SQL Server 가용성 그룹에 대해 RHEL 클러스터 구성

적용 대상: 예SQL Server(지원되는 모든 버전) - Linux

이 문서에서는 Red Hat Enterprise Linux에서 SQL Server에 대한 3노드 가용성 그룹 클러스터를 만드는 방법에 대해 설명합니다. 고가용성을 위해 Linux의 가용성 그룹에는 세 개의 노드가 필요합니다. 가용성 그룹 구성의 고가용성 및 데이터 보호를 참조하세요. 클러스터링 계층은 Pacemaker 위에 빌드된 RHEL(Red Hat Enterprise Linux) HA 추가 기능을 기반으로 합니다.

참고

Red Hat 전체 설명서에 액세스하려면 유효한 구독이 필요합니다.

클러스터 구성, 리소스 에이전트 옵션 및 관리에 대한 자세한 내용은 RHEL 참조 설명서를 참조하세요.

참고

SQL Server는 Windows Server 장애 조치(failover) 클러스터링과 통합되는 것처럼 Linux의 Pacemaker와 긴밀하게 통합되지 않습니다. SQL Server 인스턴스는 클러스터를 인식하지 않습니다. Pacemaker는 클러스터 리소스 오케스트레이션을 제공합니다. 또한 가상 네트워크 이름은 Windows Server 장애 조치(failover) 클러스터링에만 해당합니다. Pacemaker에는 해당 이름이 없습니다. 클러스터 정보를 쿼리하는 가용성 그룹 DMV(동적 관리 뷰)는 Pacemaker 클러스터에서 빈 행을 반환합니다. 장애 조치(failover) 후에 투명한 다시 연결을 위한 수신기를 만들려면 가상 IP 리소스를 만드는 데 사용되는 IP를 사용하여 DNS에 수신기 이름을 수동으로 등록합니다.

다음 섹션에서는 Pacemaker 클러스터를 설정하고 고가용성을 위해 클러스터에서 가용성 그룹을 리소스로 추가하는 단계를 안내합니다.

로드맵

고가용성을 위해 Linux 서버에서 가용성 그룹을 만드는 단계는 Windows Server 장애 조치(failover) 클러스터의 단계와 다릅니다. 다음 목록에서는 개괄적인 단계를 설명합니다.

  1. 클러스터 노드에서 SQL Server를 구성합니다.

  2. 가용성 그룹을 만듭니다.

  3. Pacemaker와 같은 클러스터 리소스 관리자를 구성합니다. 이러한 지침은 이 문서에 포함되어 있습니다.

    클러스터 리소스 관리자를 구성하는 방법은 특정 Linux 배포에 따라 다릅니다.

    중요

    프로덕션 환경에는 고가용성을 위한 STONITH와 같은 펜싱 에이전트가 필요합니다. 이 설명서의 데모에서는 펜싱 에이전트를 사용하지 않습니다. 데모는 테스트 및 유효성 검사를 위해서만 제공됩니다.

    Linux 클러스터는 펜싱을 사용하여 클러스터를 알려진 상태로 되돌립니다. 펜싱을 구성하는 방법은 배포 및 환경에 따라 달라집니다. 현재, 일부 클라우드 환경에서는 펜싱을 사용할 수 없습니다. 자세한 내용은 RHEL 고가용성 클러스터의 지원 정책 - 가상화 플랫폼을 참조하세요.

  4. 가용성 그룹을 클러스터의 리소스로 추가합니다.

RHEL에 대해 고가용성 구성

RHEL에 대해 고가용성을 구성하려면 고가용성 구독을 사용하도록 설정한 다음, Pacemaker를 구성합니다.

RHEL에 대해 고가용성 구독 사용

클러스터의 각 노드에는 RHEL 및 고가용성 추가 기능에 대한 적절한 구독이 있어야 합니다. Red Hat Enterprise Linux에서 고가용성 클러스터 패키지를 설치하는 방법에서 요구 사항을 검토하세요. 다음 단계에 따라 구독 및 리포지토리를 구성합니다.

  1. 시스템을 등록합니다.

    sudo subscription-manager register
    

    사용자 이름 및 암호를 제공합니다.

  2. 등록에 사용할 수 있는 풀을 나열합니다.

    sudo subscription-manager list --available
    

    사용 가능한 풀 목록에서 고가용성 구독의 풀 ID를 확인합니다.

  3. 다음 스크립트를 업데이트합니다. <pool id>를 이전 단계의 고가용성을 위한 풀 ID로 바꿉니다. 스크립트를 실행하여 구독을 연결합니다.

    sudo subscription-manager attach --pool=<pool id>
    
  4. 리포지토리를 사용하도록 설정합니다.

    RHEL 7

    sudo subscription-manager repos --enable=rhel-ha-for-rhel-7-server-rpms
    

    RHEL 8

    sudo subscription-manager repos --enable=rhel-8-for-x86_64-highavailability-rpms
    

자세한 내용은 Pacemaker - The Open Source, High Availability Cluster(Pacemaker - 오픈 소스 고가용성 클러스터)를 참조하세요.

구독을 구성한 후에는 다음 단계를 완료하여 Pacemaker를 구성합니다.

Pacemaker 구성

구독을 등록한 후에는 다음 단계를 완료하여 Pacemaker를 구성합니다.

  1. 모든 클러스터 노드에서 Pacemaker 방화벽 포트를 엽니다. firewalld를 사용하여 이러한 포트를 열려면 다음 명령을 실행합니다.

    sudo firewall-cmd --permanent --add-service=high-availability
    sudo firewall-cmd --reload
    

    방화벽에 고가용성 구성이 기본 제공되지 않는 경우 Pacemaker에 대해 다음 포트를 엽니다.

    • TCP: 포트 2224, 3121, 21064
    • UDP: 포트 5405
  2. 모든 노드에 Pacemaker 패키지를 설치합니다.

    sudo yum install pacemaker pcs fence-agents-all resource-agents
    
  3. Pacemaker 및 Corosync 패키지를 설치할 때 생성된 기본 사용자의 암호를 설정합니다. 모든 노드에서 같은 암호를 사용합니다.

    sudo passwd hacluster
    
  4. 다시 부팅 후 노드가 클러스터에 다시 조인할 수 있도록 pcsd 서비스 및 Pacemaker를 사용하도록 설정하고 시작합니다. 모든 노드에서 다음 명령을 실행합니다.

    sudo systemctl enable pcsd
    sudo systemctl start pcsd
    sudo systemctl enable pacemaker
    
  5. 클러스터를 만듭니다. 클러스터를 만들려면 다음 명령을 실행합니다.

    RHEL 7

    sudo pcs cluster auth <node1> <node2> <node3> -u hacluster -p <password for hacluster>
    sudo pcs cluster setup --name <clusterName> <node1> <node2> <node3> 
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    

    RHEL8

    RHEL 8의 경우 노드를 별도로 인증해야 합니다. 메시지가 표시되면 hacluster의 사용자 이름 및 암호를 수동으로 입력합니다.

    sudo pcs host auth <node1> <node2> <node3>
    sudo pcs cluster setup <clusterName> <node1> <node2> <node3>
    sudo pcs cluster start --all
    sudo pcs cluster enable --all
    

    참고

    이전에 같은 노드에서 클러스터를 구성한 경우 pcs cluster setup을 실행할 때 --force 옵션을 사용해야 합니다. 이 옵션은 pcs cluster destroy를 실행하는 것과 동일합니다. Pacemaker를 다시 사용하도록 설정하려면 sudo systemctl enable pacemaker를 실행합니다.

  6. SQL Server용 SQL Server 리소스 에이전트를 설치합니다. 모든 노드에서 다음 명령을 실행합니다.

    sudo yum install mssql-server-ha
    

Pacemaker가 구성된 후 pcs를 사용하여 클러스터와 상호 작용합니다. 클러스터의 한 노드에서 모든 명령을 실행합니다.

펜싱(STONITH) 구성

Pacemaker 클러스터 공급업체는 STONITH를 사용하도록 설정하고 지원되는 클러스터 설정에 대해 펜싱 디바이스를 구성하도록 요구합니다. STONITH는 “shoot the other node in the head”(헤드에 있는 다른 노드 맞추기)의 약어입니다. Cluster Resource Manager가 노드의 상태 또는 노드에 있는 리소스의 상태를 확인할 수 없는 경우에는 펜싱이 클러스터를 알려진 상태로 다시 전환합니다.

STONITH 디바이스는 펜싱 에이전트를 제공합니다. Azure의 Red Hat Enterprise Linux에서 Pacemaker 설정에서는 Azure의 이 클러스터에 대해 STONITH 디바이스를 만드는 방법을 보여 줍니다. 작업 환경에 맞게 지침을 수정하세요.

리소스 수준 펜싱은 리소스를 구성하여 중단 시 데이터 손상이 발생하지 않도록 합니다. 예를 들어 리소스 수준 펜싱을 사용하여 통신 링크가 가동 중단될 때 노드의 디스크를 오래된 것으로 표시할 수 있습니다.

노드 수준 펜싱은 노드가 리소스를 실행하지 않도록 합니다. 이 작업은 노드를 다시 설정하여 수행됩니다. Pacemaker는 다양한 펜싱 디바이스를 지원합니다. 예를 들어 서버에 대한 무정전 전원 공급 디바이스 또는 관리 인터페이스 카드가 있습니다.

STONITH 및 펜싱에 대한 자세한 내용은 다음 문서를 참조하세요.

참고

노드 수준 펜싱 구성은 사용자 환경에 따라 크게 좌우되므로 이 자습서에서는 사용하지 않도록 설정합니다(나중에 구성할 수 있음). 다음 스크립트는 노드 수준 펜싱을 사용하지 않도록 설정합니다.

sudo pcs property set stonith-enabled=false

STONITH를 사용하지 않도록 설정하는 기능은 테스트 목적으로만 제공됩니다. 프로덕션 환경에서 Pacemaker를 사용하려는 경우 해당 환경에 따라 STONITH 구현을 계획하고 사용 상태로 유지해야 합니다.

클러스터 속성 cluster-recheck-interval 설정

cluster-recheck-interval은 클러스터에서 리소스 매개 변수, 제약 조건 또는 기타 클러스터 옵션의 변경 내용을 확인하는 폴링 간격을 나타냅니다. 복제본의 작동이 중단되면 클러스터는 failure-timeout 값과 cluster-recheck-interval 값을 통해 바인딩된 간격으로 복제본을 다시 시작하려고 합니다. 예를 들어 failure-timeout을 60초로 설정하고 cluster-recheck-interval을 120초로 설정한 경우 60초보다 크고 120초보다 작은 간격으로 다시 시작이 시도됩니다. failure-timeout을 60초로 설정하고 cluster-recheck-interval을 60초보다 큰 값으로 설정하는 것이 좋습니다. cluster-recheck-interval을 작은 값으로 설정하는 것을 권장하지 않습니다.

속성 값을 2 minutes로 업데이트하려면 다음 명령을 실행합니다.

sudo pcs property set cluster-recheck-interval=2min

중요

사용 가능한 최신 Pacemaker 패키지 1.1.18-11.el7을 사용하는 모든 배포에서는 해당 값이 false일 때 start-failure-is-fatal 클러스터 설정의 동작이 변경됩니다. 이 변경 내용은 장애 조치(failover) 워크플로에 영향을 줍니다. 주 복제본이 중단될 경우 클러스터가 사용 가능한 보조 복제본 중 하나로 장애 조치(failover)되어야 합니다. 예상과 달리, 사용자는 클러스터가 실패한 주 복제본을 시작하려고 계속 시도하는 것을 보게 됩니다. 주 복제본이 영구 중단되어 온라인 상태로 전환되지 않는 경우 클러스터도 사용 가능한 다른 보조 복제본으로 장애 조치(failover)되지 않습니다. 이 변경 내용 때문에 start-failure-is-fatal을 설정하는 이전 권장 구성은 더 이상 유효하지 않으며, 설정을 기본값인 true로 되돌려야 합니다. 또한 failover-timeout 속성이 포함되도록 AG 리소스를 업데이트해야 합니다.

속성 값을 true로 업데이트하려면 다음 명령을 실행합니다.

sudo pcs property set start-failure-is-fatal=true

ag_cluster 리소스 속성 failure-timeout60s로 업데이트하려면 다음을 실행합니다.

pcs resource update ag_cluster meta failure-timeout=60s

Pacemaker 클러스터 속성에 대한 자세한 내용은 Pacemaker Clusters Properties(Pacemaker 클러스터 속성)를 참조하세요.

Pacemaker용 SQL Server 로그인 만들기

  1. 모든 SQL Server에서 Pacemaker를 위한 서버 로그인을 만듭니다. 다음 Transact-SQL이 로그인을 만듭니다.

    USE [master]
    GO
    CREATE LOGIN [pacemakerLogin] with PASSWORD= N'ComplexP@$$w0rd!'
    
    ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin]
    

가용성 그룹을 만든 이후, 노드를 추가하기 전에 pacemaker 사용자는 가용성 그룹에 대해 ALTER, CONTROL 및 VIEW DEFINITION 권한이 필요합니다.

  1. 모든 SQL Server에서 SQL Server 로그인을 위한 자격 증명을 저장합니다.

    echo 'pacemakerLogin' >> ~/pacemaker-passwd
    echo 'ComplexP@$$w0rd!' >> ~/pacemaker-passwd
    sudo mv ~/pacemaker-passwd /var/opt/mssql/secrets/passwd
    sudo chown root:root /var/opt/mssql/secrets/passwd
    sudo chmod 400 /var/opt/mssql/secrets/passwd # Only readable by root
    

가용성 그룹 리소스 만들기

가용성 그룹 리소스를 만들려면 pcs resource create 명령을 사용하고 리소스 속성을 설정합니다. 다음 명령은 이름이 ag1인 가용성 그룹에 대해 ocf:mssql:ag 마스터/하위 유형 리소스를 만듭니다.

RHEL 7

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s master notify=true

RHEL 8

RHEL 8 의 가용성과 함께, 생성 구문이 변경되었습니다. RHEL 8 을 사용하는 경우 용어 masterpromotable로 변경되었습니다. 위의 명령 대신 다음의 생성 명령을 사용합니다.

sudo pcs resource create ag_cluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=60s promotable notify=true

참고

리소스를 만들 때와 이후 정기적으로 Pacemaker 리소스 에이전트는 가용성 그룹에서 REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT의 값을 가용성 그룹의 구성을 바탕으로 자동으로 설정합니다. 예를 들어 가용성 그룹에 세 개의 동기 복제본이 있는 경우 에이전트는 REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT1로 설정합니다. 자세한 내용 및 추가 구성 옵션은 High availability and data protection for availability group configurations(가용성 그룹 구성을 위한 고가용성 및 데이터 보호)를 참조하세요.

가상 IP 리소스 만들기

가상 IP 주소 리소스를 만들려면 한 노드에서 다음 명령을 실행합니다. 네트워크의 사용 가능한 고정 IP 주소를 사용합니다. <10.128.16.240> 사이 IP 주소를 유효한 IP 주소로 바꿉니다.

sudo pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=<10.128.16.240>

Pacemaker에는 해당하는 가상 서버 이름이 없습니다. IP 주소 대신 문자열 서버 이름을 가리키는 연결 문자열을 사용하려면 DNS에 가상 IP 리소스 주소와 원하는 가상 서버 이름을 등록합니다. DR 구성의 경우 기본 및 DR 사이트의 DNS 서버에 원하는 가상 서버 이름 및 IP 주소를 등록합니다.

공동 배치 제약 조건 추가

리소스를 실행할 위치 선택과 같은, Pacemaker 클러스터의 거의 모든 결정은 점수 비교를 통해 수행됩니다. 점수는 리소스별로 계산됩니다. Cluster Resource Manager는 특정 리소스에 대해 점수가 가장 높은 노드를 선택합니다. 노드의 리소스 점수가 음수이면 해당 노드에서 리소스를 실행할 수 없습니다.

Pacemaker 클러스터에서 제약 조건을 사용하여 클러스터의 결정을 조작할 수 있습니다. 제약 조건에는 점수가 있습니다. 제약 조건의 점수가 INFINITY보다 낮으면 Pacemaker는 이 제약 조건을 권장 사항으로 간주합니다. INFINITY 점수는 필수입니다.

주 복제본과 가상 IP 리소스가 동일한 호스트에서 실행되는지 확인하려면 점수가 INFINITY인 공동 배치 제약 조건을 정의합니다. 공동 배치 제약 조건을 추가하려면 한 노드에서 다음 명령을 실행합니다.

RHEL 7

RHEL 7에서 ag_cluster 리소스를 만들 때 리소스를 ag_cluster-master로 만듭니다. RHEL 7의 다음 명령을 사용합니다.

sudo pcs constraint colocation add virtualip ag_cluster-master INFINITY with-rsc-role=Master

RHEL 8

RHEL 8에서 ag_cluster 리소스를 만들 때 리소스를 ag_cluster-clone로 만듭니다. RHEL 8의 다음 명령 형식을 사용합니다.

sudo pcs constraint colocation add virtualip with master ag_cluster-clone INFINITY with-rsc-role=Master

정렬 제약 조건 추가

공동 배치 제약 조건에는 암시적 정렬 제약 조건이 있습니다. 이 제약 조건은 가용성 그룹 리소스를 이동하기 전에 가상 IP 리소스를 이동합니다. 기본적으로 이벤트 시퀀스는 다음과 같습니다.

  1. 사용자가 node1에서 node2까지 가용성 그룹 주 복제본에 대해 pcs resource move를 실행합니다.

  2. 노드 1에서 가상 IP 리소스가 중지됩니다.

  3. 노드 2에서 가상 IP 리소스가 시작됩니다.

    참고

    이때 노드 2는 여전히 장애 조치(failover) 전 보조 복제본이지만, IP 주소가 일시적으로 노드 2를 가리킵니다.

  4. 노드 1의 가용성 그룹 주 복제본이 보조 복제본으로 수준이 내려갑니다.

  5. 노드 2의 가용성 그룹 보조 복제본이 주 복제본으로 수준이 올라갑니다.

IP 주소가 일시적으로 장애 조치(failover) 이전 보조 복제본이 있는 노드를 가리키지 않도록 하려면 정렬 제약 조건을 추가합니다.

정렬 제약 조건을 추가하려면 한 노드에서 다음 명령을 실행합니다.

RHEL 7

sudo pcs constraint order promote ag_cluster-master then start virtualip

RHEL 8

sudo pcs constraint order promote ag_cluster-clone then start virtualip

중요

클러스터를 구성하고 가용성 그룹을 클러스터 리소스로 추가한 후에는 Transact-SQL을 사용하여 가용성 그룹 리소스를 장애 조치(failover)할 수 없습니다. Linux의 SQL Server 클러스터 리소스는 WSFC(Windows Server 장애 조치(failover) 클러스터)에 있을 때처럼 운영 체제와 긴밀하게 결합되지 않습니다. SQL Server 서비스는 클러스터의 현재 상태를 인식하지 못합니다. 모든 오케스트레이션이 클러스터 관리 도구를 통해 수행됩니다. RHEL 또는 Ubuntu에서는 pcs를 사용하고 SLES에서는 crm 도구를 사용합니다.

pcs를 사용하여 가용성 그룹을 수동으로 장애 조치(failover)합니다. Transact-SQL을 사용하여 장애 조치(failover)를 시작하지 않도록 합니다. 자세한 내용은 장애 조치(failover)를 참조하세요.

다음 단계

HA 가용성 그룹 작동