SQL Server 가용성 그룹에 대한 Pacemaker 클러스터 구성

적용 대상:SQL Server - Linux

이 문서에서는 Pacemaker를 사용하여 Linux에서 3노드 클러스터를 만들고 이전에 만든 가용성 그룹을 클러스터의 리소스로 추가하는 방법을 설명합니다. 고가용성을 위해 Linux의 가용성 그룹에는 세 개의 노드가 필요합니다. 가용성 그룹 구성의 고가용성 및 데이터 보호를 참조하세요.

참고

바이어스 없는 통신

이 문서에는 이 컨텍스트에서 사용될 때 Microsoft가 불쾌한 표현으로 간주하는 용어인 슬레이브 용어에 대한 참조가 포함되어 있습니다. 이 용어가 이 문서에 나타나는 이유는 현재 소프트웨어에 나타나기 때문입니다. 소프트웨어에서 이 용어가 제거되면 문서에서 제거할 것입니다.

SQL Server는 WSFC(Windows Server 장애 조치(failover) 클러스터링)과 통합되는 것처럼 Linux의 Pacemaker와 긴밀하게 통합되지 않습니다. SQL Server 인스턴스는 클러스터를 인식하지 못하며 모든 오케스트레이션은 외부에서 온 것입니다. Pacemaker는 클러스터 리소스 오케스트레이션을 제공합니다. 또한 가상 네트워크 이름은 Windows Server 장애 조치(failover) 클러스터링 관련이 있습니다. Pacemaker에는 이와 동등한 이름이 없습니다. 클러스터 정보를 쿼리하는 가용성 그룹 DMV(동적 관리 뷰)는 Pacemaker 클러스터에서 빈 행을 반환합니다. 장애 조치(failover) 후에 투명한 다시 연결을 위한 수신기를 만들려면 가상 IP 리소스를 만드는 데 사용되는 IP를 사용하여 DNS에 수신기 이름을 수동으로 등록합니다.

장애 조치(failover) 후에도 수신기를 만들어 투명한 재연결에 계속 사용할 수 있지만, 다음 섹션에서 설명하는 것처럼 가상 IP 리소스를 만드는 데 사용되는 IP에 DNS 서버의 수신기 이름을 수동으로 등록해야 합니다.

다음 섹션에서는 지원되는 각 Linux 배포판에 대해 Pacemaker 클러스터를 설정하고 고가용성을 위해 클러스터에서 가용성 그룹을 리소스로 추가하는 단계를 안내합니다.

클러스터링 계층은 Pacemaker 위에 빌드된 RHEL(Red Hat Enterprise Linux) HA 추가 기능을 기반으로 합니다.

참고

Red Hat 전체 설명서에 액세스하려면 유효한 구독이 필요합니다.

클러스터 구성, 리소스 에이전트 옵션 및 관리에 대한 자세한 내용은 RHEL 참조 설명서를 참조하세요.

로드맵

고가용성을 위해 Linux 서버에서 가용성 그룹을 만드는 단계는 Windows Server 장애 조치(failover) 클러스터의 단계와 다릅니다. 다음 목록에서는 개괄적인 단계를 설명합니다.

  1. 클러스터 노드에서 SQL Server를 구성합니다.

  2. 가용성 그룹을 만듭니다.

  3. Pacemaker와 같은 클러스터 리소스 관리자를 구성합니다. 이러한 지침은 이 문서에 포함되어 있습니다.

    클러스터 리소스 관리자를 구성하는 방법은 특정 Linux 배포에 따라 다릅니다.

    Important

    프로덕션 환경에는 고가용성을 위해 펜싱 에이전트가 필요합니다. 이 설명서의 데모에서는 펜싱 에이전트를 사용하지 않습니다. 데모는 테스트 및 유효성 검사를 위해서만 제공됩니다. Linux 클러스터는 펜싱을 사용하여 클러스터를 알려진 상태로 되돌립니다. 펜싱을 구성하는 방법은 배포 및 환경에 따라 달라집니다. 현재 펜싱은 일부 클라우드 환경에서 사용할 수 없습니다. 자세한 내용은 RHEL 고가용성 클러스터의 지원 정책 - 가상화 플랫폼을 참조하세요.

  4. 가용성 그룹을 클러스터의 리소스로 추가합니다.

RHEL에 대해 고가용성 구성

RHEL에 대해 고가용성을 구성하려면 고가용성 구독을 사용하도록 설정한 다음, Pacemaker를 구성합니다.

RHEL에 대해 고가용성 구독 사용

클러스터의 각 노드에는 RHEL 및 고가용성 추가 기능에 대한 적절한 구독이 있어야 합니다. Red Hat Enterprise Linux에서 고가용성 클러스터 패키지를 설치하는 방법에서 요구 사항을 검토하세요. 다음 단계에 따라 구독 및 리포지토리를 구성합니다.

  1. 시스템을 등록합니다.

    sudo subscription-manager register
    

    사용자 이름 및 암호를 제공합니다.

  2. 등록에 사용할 수 있는 풀을 나열합니다.

    sudo subscription-manager list --available
    

    사용 가능한 풀 목록에서 고가용성 구독의 풀 ID를 확인합니다.

  3. 다음 스크립트를 업데이트합니다. <pool id>를 이전 단계의 고가용성을 위한 풀 ID로 바꿉니다. 스크립트를 실행하여 구독을 연결합니다.

    sudo subscription-manager attach --pool=<pool id>
    
  4. 리포지토리를 사용하도록 설정합니다.

    RHEL 7

    sudo subscription-manager repos --enable=rhel-ha-for-rhel-7-server-rpms
    

    RHEL 8

    sudo subscription-manager repos --enable=rhel-8-for-x86_64-highavailability-rpms
    

자세한 내용은 Pacemaker - The Open Source, High Availability Cluster(Pacemaker - 오픈 소스 고가용성 클러스터)를 참조하세요.

구독을 구성한 후에는 다음 단계를 완료하여 Pacemaker를 구성합니다.

Pacemaker 구성

구독을 등록한 후에는 다음 단계를 완료하여 Pacemaker를 구성합니다.

  1. 모든 클러스터 노드에서 Pacemaker 방화벽 포트를 엽니다. firewalld를 사용하여 이러한 포트를 열려면 다음 명령을 실행합니다.

    sudo firewall-cmd --permanent --add-service=high-availability
    sudo firewall-cmd --reload
    

    방화벽에 고가용성 구성이 기본 제공되지 않는 경우 Pacemaker에 대해 다음 포트를 엽니다.

    • TCP: 포트 2224, 3121, 21064
    • UDP: 포트 5405
  2. 모든 노드에 Pacemaker 패키지를 설치합니다.

    sudo yum install pacemaker pcs fence-agents-all resource-agents
    
  3. Pacemaker 및 Corosync 패키지를 설치할 때 생성된 기본 사용자의 암호를 설정합니다. 모든 노드에서 같은 암호를 사용합니다.

    sudo passwd hacluster
    
  4. 노드가 다시 시작한 후 클러스터에 다시 참가할 수 있도록 하려면 서비스 및 Pacemaker를 사용하도록 설정하고 시작 pcsd 합니다. 모든 노드에서 다음 명령을 실행합니다.

    sudo systemctl enable pcsd
    sudo systemctl start pcsd
    sudo systemctl enable pacemaker
    
  5. 클러스터를 만듭니다. 클러스터를 만들려면 다음 명령을 실행합니다.

    RHEL 7

    sudo pcs cluster auth <node1> <node2> <node3> -u hacluster -p <password for hacluster>
    sudo pcs cluster setup --name <clusterName> <node1> <node2> <node3>
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    

    RHEL8

    RHEL 8의 경우 노드를 별도로 인증해야 합니다. 메시지가 표시되면 hacluster의 사용자 이름 및 암호를 수동으로 입력합니다.

    sudo pcs host auth <node1> <node2> <node3>
    sudo pcs cluster setup <clusterName> <node1> <node2> <node3>
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    

    참고

    이전에 같은 노드에서 클러스터를 구성한 경우 pcs cluster setup을 실행할 때 --force 옵션을 사용해야 합니다. 이 옵션은 pcs cluster destroy를 실행하는 것과 동일합니다. Pacemaker를 다시 사용하도록 설정하려면 sudo systemctl enable pacemaker를 실행합니다.

  6. SQL Server용 SQL Server 리소스 에이전트를 설치합니다. 모든 노드에서 다음 명령을 실행합니다.

    sudo yum install mssql-server-ha
    

Pacemaker가 구성된 후 pcs를 사용하여 클러스터와 상호 작용합니다. 클러스터의 한 노드에서 모든 명령을 실행합니다.

여러 NIC(네트워크 인터페이스)에 대한 고려 사항

여러 NIC가 있는 서버에서 고가용성을 설정하는 경우 다음 제안 사항을 따르세요.

  • 여러 NIC의 서버 IP 주소가 각 노드에서 Linux 서버의 호스트 이름으로 확인되도록 hosts 파일이 설정되어 있는지 확인합니다.

  • Pacemaker를 사용하여 클러스터를 설정할 때 서버의 호스트 이름을 사용하여 모든 NIC에 대한 구성을 설정하도록 Corosync를 구성해야 합니다. 단일 NIC를 통한 Pacemaker/Corosync 통신만 원합니다. Pacemaker 클러스터가 구성되면 corosync.conf 파일의 구성을 수정하고 Pacemaker/Corosync 통신에 사용할 전용 NIC의 IP 주소를 업데이트합니다.

  • corosync.conf 파일에 지정된 <hostname>은 역방향 조회(ping -a <ip_address>)를 수행할 때 지정된 출력과 동일해야 하며 호스트에 구성된 짧은 이름이어야 합니다. hosts 파일이 이름 확인에 적합한 IP 주소를 나타내는지도 확인합니다.

corosync.conf 파일 예제의 변경 내용은 아래에 강조 표시되어 있습니다.

  nodelist {
    node {
        ring0_addr: <ip_address_of_node1_NIC1>
        name: <hostname_of_node1>
        nodeid: 1
    }
    node {
        ring0_addr: <ip_address_of_node2_NIC1>
        name: <hostname_of_node2>
        nodeid: 2
    }
    node {
        ring0_addr: <ip_address_of_node3_NIC1>
        name: <hostname_of_node3>
        nodeid: 3
    }
  }

펜싱 디바이스 구성

Pacemaker 클러스터 공급업체는 지원되는 클러스터 설정에 대해 구성된 펜싱 디바이스를 사용하여 실패한 노드를 펜싱해야 합니다. 클러스터 리소스 관리자가 노드 또는 노드의 리소스 상태를 확인할 수 없는 경우 펜싱은 클러스터를 다시 알려진 상태로 만듭니다.

펜싱 디바이스는 펜싱 에이전트를 제공합니다. Azure의 Red Hat Enterprise Linux에서 Pacemaker를 설정하면 Azure 에서 이 클러스터에 대한 펜싱 디바이스를 만드는 방법의 예가 제공됩니다. 작업 환경에 맞게 지침을 수정하세요.

리소스 수준 펜싱은 리소스를 구성하여 중단 시 데이터가 손상되지 않도록 합니다. 예를 들어 리소스 수준 펜싱을 사용하여 통신 링크가 가동 중단될 때 노드의 디스크를 오래된 것으로 표시할 수 있습니다.

노드 수준 펜싱은 노드가 리소스를 실행하지 않도록 합니다. 이 작업은 노드를 다시 설정하여 수행됩니다. Pacemaker는 다양한 펜싱 디바이스를 지원합니다. 예를 들어 서버에 대한 무정전 전원 공급 디바이스 또는 관리 인터페이스 카드가 있습니다.

실패한 노드를 펜싱하는 방법에 대한 자세한 내용은 다음 문서를 참조하세요.

참고

노드 수준 펜싱 구성은 사용자 환경에 따라 크게 좌우되므로 이 자습서에서는 사용하지 않도록 설정합니다(나중에 구성할 수 있음). 다음 스크립트는 노드 수준 펜싱을 사용하지 않도록 설정합니다.

sudo pcs property set stonith-enabled=false

펜싱을 사용하지 않도록 설정하는 것은 테스트 목적으로만 사용됩니다. 프로덕션 환경에서 Pacemaker를 사용하려는 경우 환경에 따라 펜싱 구현을 계획하고 사용하도록 설정해야 합니다.

클러스터 속성 cluster-recheck-interval 설정

cluster-recheck-interval는 리소스 매개 변수, 제약 조건 또는 기타 클러스터 옵션의 변경 내용에 대해 클러스터가 검사 폴링 간격을 나타냅니다. 복제본의 작동이 중단되면 클러스터는 failure-timeout 값과 cluster-recheck-interval 값을 통해 바인딩된 간격으로 복제본을 다시 시작하려고 합니다. 예를 들어 failure-timeout을 60초로 설정하고 cluster-recheck-interval을 120초로 설정한 경우 60초보다 크고 120초보다 작은 간격으로 다시 시작이 시도됩니다. failure-timeout을 60초로 설정하고 cluster-recheck-interval을 60초보다 큰 값으로 설정하는 것이 좋습니다. cluster-recheck-interval을 더 작은 값으로 설정하는 것은 권장되지 않습니다.

속성 값을 2 minutes로 업데이트하려면 다음 명령을 실행합니다.

sudo pcs property set cluster-recheck-interval=2min

Pacemaker 클러스터에서 관리하는 가용성 그룹 리소스가 이미 있는 경우, Pacemaker 패키지 1.1.18-11.el7에서는 해당 값이 false일 때 start-failure-is-fatal 클러스터 설정 동작이 변경되었습니다. 이 변경 내용은 장애 조치(failover) 워크플로에 영향을 줍니다. 주 복제본이 중단될 경우 클러스터가 사용 가능한 보조 복제본 중 하나로 장애 조치(failover)되어야 합니다. 대신, 사용자는 클러스터가 실패한 기본 복제본(replica) 시작하려고 계속 시도한다는 것을 알 수 있습니다. 주 복제본이 영구 중단되어 온라인 상태로 전환되지 않는 경우 클러스터도 사용 가능한 다른 보조 복제본으로 장애 조치(failover)되지 않습니다. 이 변경 내용 때문에 start-failure-is-fatal을 설정하는 이전 권장 구성은 더 이상 유효하지 않으며, 설정을 기본값인 true로 되돌려야 합니다.

또한 failover-timeout 속성이 포함되도록 AG 리소스를 업데이트해야 합니다.

속성 값을 true로 업데이트하려면 다음 명령을 실행합니다.

sudo pcs property set start-failure-is-fatal=true

ag_cluster 리소스 속성 failure-timeout60s로 업데이트하려면 다음을 실행합니다.

pcs resource update ag_cluster meta failure-timeout=60s

Pacemaker 클러스터 속성에 대한 자세한 내용은 Pacemaker Clusters Properties(Pacemaker 클러스터 속성)를 참조하세요.

Pacemaker용 SQL Server 로그인 만들기

  1. 모든 SQL Server 인스턴스에서 Pacemaker용 서버 로그인을 만듭니다. 다음 Transact-SQL이 로그인을 만듭니다.

    USE [master]
    GO
    CREATE LOGIN [pacemakerLogin] with PASSWORD= N'ComplexP@$$w0rd!';
    
    ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
    

    가용성 그룹을 만든 이후, 노드를 추가하기 전에 pacemaker 사용자는 가용성 그룹에 대해 ALTER, CONTROL 및 VIEW DEFINITION 권한이 필요합니다.

  2. 모든 SQL Server 인스턴스에서 SQL Server 로그인에 대한 자격 증명을 저장합니다.

    echo 'pacemakerLogin' >> ~/pacemaker-passwd
    echo 'ComplexP@$$w0rd!' >> ~/pacemaker-passwd
    sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
    sudo chown root:root /var/opt/mssql/secrets/passwd
    sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root
    

가용성 그룹 리소스 만들기

가용성 그룹 리소스를 만들려면 pcs resource create 명령을 사용하고 리소스 속성을 설정합니다. 다음 명령은 이름이 ag1인 가용성 그룹에 대해 ocf:mssql:ag 마스터/하위 유형 리소스를 만듭니다.

RHEL 7

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s master notify=true

RHEL 8

RHEL 8의 가용성과 함께, 생성 구문이 변경되었습니다. RHEL 8을 사용하는 경우 용어 master 가 .로 promotable변경되었습니다. 위의 명령 대신 다음의 생성 명령을 사용합니다.

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s promotable notify=true

참고

리소스를 만들 때와 이후 정기적으로 Pacemaker 리소스 에이전트는 가용성 그룹에서 REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT의 값을 가용성 그룹의 구성을 바탕으로 자동으로 설정합니다. 예를 들어 가용성 그룹에 세 개의 동기 복제본이 있는 경우 에이전트는 REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT1로 설정합니다. 자세한 내용 및 추가 구성 옵션은 High availability and data protection for availability group configurations(가용성 그룹 구성을 위한 고가용성 및 데이터 보호)를 참조하세요.

가상 IP 리소스 만들기

가상 IP 주소 리소스를 만들려면 한 노드에서 다음 명령을 실행합니다. 네트워크의 사용 가능한 고정 IP 주소를 사용합니다. <10.128.16.240> 사이 IP 주소를 유효한 IP 주소로 바꿉니다.

sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=<10.128.16.240>

Pacemaker에는 해당하는 가상 서버 이름이 없습니다. IP 주소 대신 문자열 서버 이름을 가리키는 연결 문자열을 사용하려면 DNS에 가상 IP 리소스 주소와 원하는 가상 서버 이름을 등록합니다. DR 구성의 경우 기본 및 DR 사이트의 DNS 서버에 원하는 가상 서버 이름 및 IP 주소를 등록합니다.

공동 배치 제약 조건 추가

리소스를 실행할 위치 선택과 같은, Pacemaker 클러스터의 거의 모든 결정은 점수 비교를 통해 수행됩니다. 점수는 리소스별로 계산됩니다. Cluster Resource Manager는 특정 리소스에 대해 점수가 가장 높은 노드를 선택합니다. 노드의 리소스 점수가 음수이면 해당 노드에서 리소스를 실행할 수 없습니다.

Pacemaker 클러스터에서 제약 조건을 사용하여 클러스터의 결정을 조작할 수 있습니다. 제약 조건에는 점수가 있습니다. 제약 조건의 점수가 INFINITY보다 낮으면 Pacemaker는 이 제약 조건을 권장 사항으로 간주합니다. INFINITY 점수는 필수입니다.

주 복제본과 가상 IP 리소스가 동일한 호스트에서 실행되는지 확인하려면 점수가 INFINITY인 공동 배치 제약 조건을 정의합니다. 공동 배치 제약 조건을 추가하려면 한 노드에서 다음 명령을 실행합니다.

RHEL 7

RHEL 7에서 ag_cluster 리소스를 만들 때 리소스를 ag_cluster-master로 만듭니다. RHEL 7의 다음 명령을 사용합니다.

sudo pcs constraint colocation add virtualip ag_cluster-master INFINITY with-rsc-role=Master

RHEL 8

RHEL 8에서 ag_cluster 리소스를 만들 때 리소스를 ag_cluster-clone로 만듭니다. RHEL 8의 다음 명령 형식을 사용합니다.

sudo pcs constraint colocation add virtualip with master ag_cluster-clone INFINITY with-rsc-role=Master

정렬 제약 조건 추가

공동 배치 제약 조건에는 암시적 정렬 제약 조건이 있습니다. 이 제약 조건은 가용성 그룹 리소스를 이동하기 전에 가상 IP 리소스를 이동합니다. 기본적으로 이벤트 시퀀스는 다음과 같습니다.

  1. 사용자가 node1에서 node2까지 가용성 그룹 주 복제본에 대해 pcs resource move를 실행합니다.

  2. 노드 1에서 가상 IP 리소스가 중지됩니다.

  3. 노드 2에서 가상 IP 리소스가 시작됩니다.

    참고

    이때 노드 2는 여전히 장애 조치(failover) 전 보조 복제본이지만, IP 주소가 일시적으로 노드 2를 가리킵니다.

  4. 노드 1의 가용성 그룹 주 복제본이 보조 복제본으로 수준이 내려갑니다.

  5. 노드 2의 가용성 그룹 보조 복제본이 주 복제본으로 수준이 올라갑니다.

IP 주소가 일시적으로 장애 조치(failover) 이전 보조 복제본이 있는 노드를 가리키지 않도록 하려면 정렬 제약 조건을 추가합니다.

정렬 제약 조건을 추가하려면 한 노드에서 다음 명령을 실행합니다.

RHEL 7

sudo pcs constraint order promote ag_cluster-master then start virtualip

RHEL 8

sudo pcs constraint order promote ag_cluster-clone then start virtualip

Important

클러스터를 구성하고 가용성 그룹을 클러스터 리소스로 추가한 후에는 Transact-SQL을 사용하여 가용성 그룹 리소스를 장애 조치(failover)할 수 없습니다. Linux의 SQL Server 클러스터 리소스는 WSFC(Windows Server 장애 조치(failover) 클러스터)에 있을 때처럼 운영 체제와 긴밀하게 결합되지 않습니다. SQL Server 서비스는 클러스터의 존재를 인식하지 못합니다. 모든 오케스트레이션이 클러스터 관리 도구를 통해 수행됩니다. RHEL 또는 Ubuntu에서는 pcs를 사용하고 SLES에서는 crm 도구를 사용합니다.

pcs를 사용하여 가용성 그룹을 수동으로 장애 조치(failover)합니다. Transact-SQL을 사용하여 장애 조치(failover)를 시작하지 않도록 합니다. 자세한 내용은 장애 조치(failover)를 참조하세요.