Azure VM의 SQL Server에 대한 Always On 가용성 그룹

적용 대상:Azure VM 기반 SQL Server

이 문서에서는 Azure VMs(Virtual Machines)의 SQL Server에 대한 Always On AG(가용성 그룹)를 소개합니다.

시작하려면 가용성 그룹 자습서를 참조하세요.

개요

Azure Virtual Machines의 Always On 가용성 그룹은 온-프레미스의 Always On 가용성 그룹과 유사하며 기본 Windows Server 장애 조치(failover) 클러스터를 사용합니다. 그러나 가상 머신은 Azure에서 호스팅되므로 VM 중복성 및 Azure 네트워크의 트래픽 라우팅과 같은 몇 가지 추가 고려 사항도 있습니다.

다음 다이어그램에서는 Azure VM의 SQL Server에 대한 가용성 그룹을 보여 줍니다.

Availability Group

참고 항목

이제 Azure Migrate를 사용하여 Azure VM의 SQL Server에 대한 가용성 그룹 솔루션을 리프트 앤 시프트할 수 있습니다. 자세한 내용은 가용성 그룹 마이그레이션을 참조하세요.

VM 중복성

중복성 및 고가용성을 강화하려면 SQL Server VM이 동일한 가용성 집합 또는 다른 가용성 영역에 있어야 합니다.

동일한 가용성 집합에 VM 집합을 배치하면 장비 장애(가용성 집합 내의 VM은 리소스를 공유하지 않음)로 인한 데이터 센터 내의 운영 중단이나 업데이트(가용성 집합 내의 VM은 동시에 업데이트되지 않음)로부터 보호됩니다.

가용성 영역은 영역 내의 데이터 센터 세트를 나타내는 각 영역으로 전체 데이터 센터의 장애로부터 보호합니다. 리소스를 서로 다른 가용성 영역에 배치하면 데이터 센터 수준의 운영 중단으로 인해 모든 VM이 오프라인 상태가 되지는 않습니다.

Azure VM을 만들 때는 가용성 집합과 가용성 영역 중 하나를 선택하여 구성해야 합니다. 한 Azure VM이 두 가지 모두에 있을 수 없습니다.

가용성 영역은 가용성 집합보다 더 나은 가용성을 제공할 수 있지만(99.99% / 99.95%) 성능도 고려해야 합니다. 가용성 집합 내의 VM은 근접 배치 그룹에 배치되어 서로 간에 가까운 위치가 보장되므로 네트워크 대기 시간을 최소화할 수 있습니다. 서로 다른 가용성 영역에 있는 VM의 경우 네트워크 대기 시간이 더 커집니다. 이로 인해 주 복제본과 보조 복제본 간에 데이터를 동기화하는 데 걸리는 시간이 늘어날 수 있습니다. 이로 인해 주 복제본에 지연이 발생할 뿐만 아니라 계획되지 않은 장애 조치 시 데이터 손실 가능성이 높아질 수 있습니다. 부하 상태에서 제안된 솔루션을 테스트하고 성능 및 가용성 모두에 대해 SLA를 충족하는지 확인하는 것이 중요합니다.

연결

가용성 그룹 수신기에 연결하는 온-프레미스 환경과 일치시키려면 SQL Server VM을 동일한 가상 네트워크 내의 여러 서브넷에 배포합니다. 여러 서브넷이 있으면 트래픽을 수신기로 라우팅하기 위해 Azure Load Balancer 또는 DNN(분산 네트워크 이름)에 대한 추가 종속성이 필요하지 않습니다.

SQL Server VM을 단일 서브넷에 배포하는 경우 트래픽을 가용성 그룹 수신기로 라우팅하도록 VNN(가상 네트워크 이름) 및 Azure Load Balancer 또는 DNN(분산 네트워크 이름)을 구성할 수 있습니다. 두 이상의 차이점을 검토한 다음, 가용성 그룹에 대해 DNN(분산 네트워크 이름) 또는 VNN(가상 네트워크 이름)을 배포합니다.

DNN를 사용하는 경우 대부분의 SQL Server 기능이 가용성 그룹에서 투명하게 작동하지만 특별한 고려 사항이 필요할 수 있는 특정 기능이 있습니다. 자세히 알아보려면 AG 및 DNN 상호 운용성을 참조하세요.

또한 VNN 수신기 및 DNN 수신기의 기능 간에는 주의해야 할 몇 가지 동작 차이점이 있습니다.

  • 장애 조치(failover)시간: 네트워크 부하 분산 장치가 오류 이벤트를 감지하고 라우팅을 변경할 때까지 기다릴 필요가 없으므로 DNN 수신기를 사용할 때 장애 조치(failover) 시간이 더 단축됩니다.
  • 기존 연결: 장애 조치 가용성 그룹 내의 특정 데이터베이스에 대한 연결이 끊어지지만 장애 조치 프로세스 중에 DNN이 온라인 상태를 유지하므로 주 복제본에 대한 다른 연결은 열린 상태로 유지됩니다. 이것은 가용성 그룹이 장애 조치되고 수신기가 오프라인으로 전환되고 주 복제본이 보조 역할로 전환되어 주 복제본에 대한 모든 연결이 닫히게 되는 기존 VNN 환경과는 다릅니다. DNN 수신기를 사용하는 경우 장애 조치 시 연결이 새 주 복제본으로 리디렉션되도록 애플리케이션 연결 문자열을 조정해야 할 수 있습니다.
  • 트랜잭션 열기: 장애 조치 가용성 그룹의 데이터베이스에 대해 열린 트랜잭션이 닫히고 롤백되며 수동으로 다시 연결해야 합니다. 예를 들어, SQL Server Management Studio에서 쿼리 창을 닫고 새 창을 엽니다.

Azure에서 VNN 수신기를 설정하려면 부하 분산 장치가 필요합니다. Azure의 부하 분산 장치에는 외부(퍼블릭) 또는 내부라는 두 가지 기본 옵션이 있습니다. 외부(퍼블릭) 부하 분산 장치는 인터넷에 연결되며 인터넷을 통해 액세스할 수 있는 공용 가상 IP에 연결됩니다. 내부 부하 분산 장치는 동일한 가상 네트워크 내에 있는 클라이언트만 지원합니다. 각 부하 분산 장치 유형에 대해 Direct Server Return을 사용하도록 설정해야 합니다.

서비스 인스턴스에 직접 연결하면 각 가용성 복제본에 개별적으로 연결할 수 있습니다. 또한, 가용성 그룹은 데이터베이스 미러링 클라이언트와 역방향 호환이 가능하므로 복제본이 데이터베이스 미러링과 유사하게 구성된 이상 데이터베이스 미러링 파트너와 같이 가용성 복제본에 연결할 수 있습니다.

  • 하나의 주 복제본과 하나의 보조 복제본이 있습니다.
  • 보조 복제본은 읽을 수 없도록 구성(읽기 가능한 보조 옵션을 아니요로 설정)됩니다.

ADO.NET 또는 SQL Server Native Client를 사용하는 이 데이터베이스 미러링과 비슷한 구성에 해당하는 클라이언트 연결 문자열의 예제는 다음과 같습니다.

Data Source=ReplicaServer1;Failover Partner=ReplicaServer2;Initial Catalog=AvailabilityDatabase;

클라이언트 연결에 대한 자세한 내용은 다음을 참조하세요.

단일 서브넷에는 부하 분산 장치가 필요합니다.

기존 온-프레미스 WSFC(Windows Server 장애 조치(failover) 클러스터)에서 가용성 그룹 수신기를 만들면 사용자가 제공한 IP 주소를 사용하여 수신기에 대한 DNS 레코드가 생성되고, 이 IP 주소는 온-프레미스 네트워크의 스위치 및 라우터 ARP 테이블에 있는 현재 주 복제본의 MAC 주소에 매핑됩니다. 클러스터는 장애 조치(failover) 후 새 주 복제본이 선택될 때마다 네트워크에 최신 IP-MAC 주소 매핑을 브로드캐스트하는 GARP(Gratuitous ARP)를 사용하여 이 작업을 수행합니다. 이 경우 IP 주소는 수신기용이고 MAC은 현재 주 복제본용입니다. GARP는 스위치 및 라우터에 대한 ARP 테이블 항목을 강제로 업데이트하고 수신기 IP 주소에 연결하는 모든 사용자는 현재 주 복제본으로 원활하게 라우팅됩니다.

보안상의 이유로 퍼블릭 클라우드(Azure, Google, AWS)에서 브로드캐스트할 수 없으므로 Azure에서 ARP 및 GARP의 사용은 지원되지 않습니다. 네트워킹 환경의 이러한 차이를 극복하기 위해 단일 서브넷 가용성 그룹의 SQL Server VM은 부하 분산 장치를 사용하여 트래픽을 적절한 IP 주소로 라우팅합니다. 부하 분산 장치는 수신기에 해당하는 프런트 엔드 IP 주소로 구성되고 프로브 포트가 할당되므로 Azure Load Balancer는 가용성 그룹의 복제본(replica) 상태에 대해 주기적으로 폴링합니다. 주 복제본 SQL Server VM만 TCP 프로브에 응답하므로 수신 트래픽은 프로브에 성공적으로 응답하는 VM으로 라우팅됩니다. 또한 해당 프로브 포트는 WSFC 클러스터 IP로 구성되어 주 복제본이 TCP 프로브에 응답하도록 합니다.

단일 서브넷에 구성된 가용성 그룹은 부하 분산 장치 또는 DNN(분산 네트워크 이름)을 사용하여 트래픽을 적절한 복제본(replica)으로 라우팅해야 합니다. 이러한 종속성을 방지하려면 가용성 그룹 수신기가 각 서브넷의 복제본(replica)에 대한 IP 주소로 구성되고 트래픽을 적절하게 라우팅할 수 있도록 여러 서브넷에서 가용성 그룹을 구성합니다.

단일 서브넷에서 가용성 그룹을 이미 만든 경우 이를 다중 서브넷 환경으로 마이그레이션할 수 있습니다.

임대 메커니즘

SQL Server의 경우 AG 리소스 DLL은 AG 임대 메커니즘 및 Always On 상태 검색에 따른 AG의 상태를 결정합니다. AG 리소스 DLL은 IsAlive 작업을 통해 리소스 상태를 노출합니다. 리소스 모니터는 CrossSubnetDelaySameSubnetDelay 클러스터 전체 값으로 설정된 클러스터 하트비트 간격으로 IsAlive를 폴링합니다. 리소스 DLL에 대한 IsAlive 호출이 AG의 상태가 정상이 아니라고 반환할 때마다 주 노드에서 클러스터 서비스는 장애 조치를 시작합니다.

AG 리소스 DLL은 내부 SQL Server 구성 요소의 상태를 모니터링합니다. Sp_server_diagnostics는 HealthCheckTimeout에 의해 제어되는 간격으로 SQL Server에 이러한 구성 요소의 상태를 보고합니다.

다른 장애 조치 메커니즘과 달리 SQL Server 인스턴스는 임대 메커니즘에서 활성 역할을 수행합니다. 임대 메커니즘은 클러스터 리소스 호스트와 SQL Server 프로세스 간에 LooksAlive 유효성 검사로 사용됩니다. 메커니즘은 서로의 상태를 확인하고 궁극적으로 분리 장애(split-brain) 시나리오를 방지하여 양쪽(클러스터 서비스 및 SQL Server 서비스)이 자주 접촉하는 상태에 있는지 확인하는 데 사용됩니다.

Azure VM에서 AG를 구성할 때 이러한 임곗값을 온-프레미스 환경에서 구성할 때와는 다르게 구성해야 하는 경우가 많습니다. Azure VM에 대한 모범 사례에 따라 임계값 설정을 구성하려면 클러스터 모범 사례를 참조하세요.

네트워크 구성

트래픽을 가용성 그룹 수신기로 라우팅하는 Azure Load Balancer 또는 DNN(분산 네트워크 이름)에 대한 종속성을 방지하기 위해 가능한 경우 SQL Server VM을 여러 서브넷에 배포합니다.

Azure VM 장애 조치(failover) 클러스터에서는 서버(클러스터 노드)당 단일 NIC를 사용하는 것이 좋습니다. Azure 네트워킹에는 물리적 중복성이 있으므로 Azure VM 장애 조치(failover) 클러스터에서 추가 NIC가 필요하지 않습니다. 클러스터 유효성 검사 보고서는 노드가 단일 네트워크에서만 연결 가능하다는 경고를 표시하지만, Azure VM 장애 조치(failover) 클러스터에서는 이 경고를 무시해도 됩니다.

기본 가용성 그룹

기본 가용성 그룹은 두 개 이상의 보조 복제본을 허용하지 않으며 보조 복제본에 대한 읽기 권한이 없으므로 기본 가용성 그룹에 데이터베이스 미러링 연결 문자열을 사용할 수 있습니다. 연결 문자열을 사용하면 수신기가 필요하지 않습니다. Azure VM의 가용성 그룹에서는 추가 데이터베이스에 대한 수신기가 여러 개인 경우 수신기 종속성을 제거하면 부하 분산 장치가 필요하지 않거나 부하 분산 장치에 IP를 더 추가할 필요가 없으므로 유용합니다.

예를 들어, TCP/IP를 사용하여 기본 AG(또는 보조 복제본이 하나만 있고 보조 복제본에서 읽기 액세스가 허용되지 않는 AG)의 Replica_A 또는 Replica_B에 있는 AG 데이터베이스 AdventureWorks에 명시적으로 연결하려면 클라이언트 애플리케이션은 AG에 성공적으로 연결하기 위해 다음 데이터베이스 미러링 연결 문자열을 제공할 수 있습니다.

Server=Replica_A; Failover_Partner=Replica_B; Database=AdventureWorks; Network=dbmssocn

배포 옵션

SQL Server VM을 동일한 Azure 가상 네트워크 내의 여러 서브넷에 만들면 Always On 가용성 그룹에 대한 Azure Load Balancer 또는 DNN(분산 네트워크 이름)이 필요하지 않습니다.

가용성 그룹을 Azure VM의 SQL Server에 배포하는 여러 가지 옵션이 있으며, 일부는 다른 옵션보다 더 많은 자동화를 사용합니다.

사용 가능한 옵션을 비교한 표는 다음과 같습니다.

Azure Portal, Azure CLI/PowerShell 빠른 시작 템플릿 수동(단일 서브넷) 수동(다중 서브넷)
SQL Server 버전 2016 이상 2016 이상 2016 이상 2012 이상 2012 이상
SQL Server 에디션 Enterprise Enterprise Enterprise Enterprise, Standard Enterprise, Standard
Windows Server 버전 2016 이상 2016 이상 2016 이상 모두 모두
사용자에 대한 클러스터 만들기 없음
가용성 그룹 및 수신기 만들기 Yes 없음 없음 없음
독립적으로 수신기 및 부하 분산 장치 만들기 해당 없음 아니오 없음 해당 없음
이 메서드를 사용하여 DNN 수신기를 만들 수 있는지 여부 해당 없음 아니오 없음 해당 없음
WSFC 쿼럼 구성 클라우드 감시 클라우드 감시 클라우드 감시 모두 모두
여러 지역이 포함된 DR 아니요 없음 없음
다중 서브넷 지원 없음 아니요 해당 없음
기존 AD 지원
동일한 지역의 다중 영역이 포함된 DR
AD가 없는 분산 AG 아니요 없음 없음
클러스터가 없는 분산 AG 아니요 없음 없음
부하 분산 장치 또는 DNN 필요 아니요

다음 단계

시작하려면 HADR 모범 사례를 검토한 다음 가용성 그룹 자습서를 사용하여 가용성 그룹을 수동으로 배포합니다.

자세한 내용은 다음을 참조하세요.