장애 조치(failover) 클러스터 문제 해결

적용 대상:SQL Server

이 항목에서는 다음 문제에 대한 정보를 제공합니다.

  • 기본 문제 해결 단계

  • 장애 조치(failover) 클러스터 오류 복구

  • 가장 일반적인 장애 조치(failover) 클러스터링 문제 해결

  • 확장 저장 프로시저 및 COM 개체 사용

기본 문제 해결 단계

첫 번째 진단 단계는 새 클러스터 유효성 검사를 실행하는 것입니다. 유효성 검사에 대한 자세한 내용은 장애 조치(failover) 클러스터 만들기: 구성 유효성 검사를 참조하세요. 이 작업은 온라인 클러스터 리소스에 영향을 주지 않으므로 서비스를 중단하지 않고 완료할 수 있습니다. 클러스터가 배포되기 전, 클러스터를 만드는 동안 및 클러스터가 실행되는 동안을 포함하여 장애 조치(failover) 클러스터링 기능이 설치되면 언제든지 유효성 검사를 실행할 수 있습니다. 실제로 클러스터가 사용 중이면 추가 테스트가 실행되어 고가용성 워크로드에 대한 모범 사례가 준수되고 있는지 확인합니다. 이러한 수십 개의 테스트 중에서 일부 테스트만 실행 중인 클러스터 워크로드에 영향을 주며, 모두 스토리지 범주 내에 있으므로 이 전체 범주를 건너뛰는 것이 중단 테스트를 방지하는 쉬운 방법입니다.
장애 조치(failover) 클러스터링에는 유효성 검사 중에 스토리지 테스트를 실행할 때 실수로 인한 가동 중지 시간을 방지하는 기본 제공 보호 기능이 제공됩니다. 유효성 검사가 시작될 때 클러스터에 온라인 그룹이 있고 스토리지 테스트가 선택된 채로 남아 있는 경우 모든 테스트를 실행할지(그리고 가동 중지 시간을 발생시킬지) 아니면 가동 중지 시간을 방지하기 위해 온라인 그룹의 디스크 테스트를 건너뛸지에 대한 확인 메시지를 사용자에게 표시합니다. 전체 스토리지 범주가 테스트에서 제외되면 이 프롬프트가 표시되지 않습니다. 이렇게 하면 가동 중지 시간 없이 클러스터 유효성 검사를 수행할 수 있습니다.

클러스터의 유효성을 다시 검사하는 방법

  1. 장애 조치(failover) 클러스터 스냅인의 콘솔 트리에서 장애 조치(failover) 클러스터 관리 가 선택되어 있는지 확인하고 관리아래에서 구성 유효성 검사를 클릭합니다.

  2. 마법사의 지침에 따라 서버 및 테스트를 지정하고 테스트를 실행합니다. 테스트가 실행된 후 요약 페이지가 나타납니다.

  3. 요약 페이지에서 보고서 보기를 클릭하고 테스트 결과를 확인합니다.

    마법사를 닫은 후 테스트 결과를 보려면 %SystemRoot%\Cluster\Reports\Validation Report date and time.html 을 확인합니다. 여기서 %SystemRoot% 는 운영 체제가 설치된 폴더입니다(예: C:\Windows).

  4. 결과를 해석하는 데 도움이 되는 도움말 항목을 보려면 클러스터 유효성 검사 테스트에 대한 자세한 정보를 클릭합니다.

마법사를 닫은 후 클러스터 유효성 검사에 대한 도움말 항목을 보려면 장애 조치(failover) 클러스터 스냅인에서 도움말, 도움말 항목, 콘텐츠를 차례로 클릭하고, 장애 조치(failover) 클러스터 도움말에 대한 콘텐츠를 확장하고, 장애 조치(failover) 클러스터 구성 유효성 검사를 클릭합니다. 유효성 검사 마법사가 완료되면 요약 보고서에 결과가 표시됩니다. 모든 테스트는 녹색 확인 표시 또는 경우에 따라 노란색 삼각형(경고)과 함께 통과해야 합니다. 문제 영역(빨간색 X 또는 노란색 물음표)을 찾는 경우 테스트 결과를 요약하는 보고서 부분에서 개별 테스트를 클릭하여 세부 정보를 검토합니다. 빨간색 X 문제는 SQL Server 문제를 해결하기 전에 해결해야 합니다.

업데이트 설치

업데이트 설치는 시스템에서 문제를 피하기 위한 중요한 부분입니다. 유용한 링크:

장애 조치(Failover) 클러스터 오류 복구

일반적으로 장애 조치(failover) 클러스터 오류의 원인은 다음 두 가지 중 하나입니다.

  • 이중 노드 클러스터의 한 노드에서 발생한 하드웨어 오류. 이 하드웨어 오류는 SCSI 카드 또는 운영 체제의 오류에 의해 발생할 수 있습니다.

    이 오류를 복구하려면 SQL Server 설치 프로그램을 사용하여 장애 조치(Failover) 클러스터에서 실패한 노드를 제거하고, 컴퓨터를 오프라인으로 사용하여 하드웨어 오류를 해결하고, 컴퓨터를 백업한 다음, 복구한 노드를 장애 조치(failover) 클러스터 인스턴스에 다시 추가합니다.

    자세한 내용은 새 SQL Server 장애 조치(failover) 클러스터 만들기(설치 프로그램)장애 조치(failover) 클러스터 인스턴스 오류 복구를 참조하세요.

  • 운영 체제 오류. 이 경우 노드는 오프라인이지만 복구 불능 상태는 아닙니다.

    운영 체제 오류를 복구하려면 노드를 복구하고 장애 조치(Failover)를 테스트합니다. SQL Server 인스턴스에서 장애 조치(Failover)가 제대로 수행되지 않으면 SQL Server 설치 프로그램을 사용하여 장애 조치(Failover) 클러스터에서 SQL Server 를 제거하고 필요한 복구를 수행한 다음 컴퓨터를 다시 온라인 상태로 만들고 복구한 노드를 다시 장애 조치(Failover) 클러스터 인스턴스에 추가합니다.

    이 방법으로 운영 체제 오류를 복구하면 시간이 걸릴 수 있습니다. 운영 체제 오류를 쉽게 복구할 수 있다면 이 방법을 사용하지 마십시오.

    자세한 내용은 새 SQL Server 장애 조치(failover) 클러스터 만들기(설치 프로그램)방법: 시나리오 2의 장애 조치(failover) 클러스터 오류 복구를 참조하세요.

일반적인 문제 해결

다음 목록에서는 일반적인 사용 문제와 이를 해결하는 방법을 설명합니다.

문제: SQL Server를 설치하는 명령 프롬프트 구문을 잘못 사용함

문제점 1:/qn 스위치는 모든 설치 대화 상자와 오류 메시지를 표시하지 않도록 지정하는 스위치이므로 명령 프롬프트에서 /qn 스위치를 사용하면 설치 문제를 진단하기가 어렵습니다. /qn 스위치를 지정하면 오류 메시지를 포함한 모든 설치 메시지가 설치 로그 파일에 기록됩니다. 로그 파일에 대한 자세한 내용은 SQL Server 설치 로그 파일 보기 및 읽기를 참조하세요.

해결 방법 1: /qn 스위치 대신 /qb 스위치를 사용합니다. /qb 스위치를 사용하면 오류 메시지를 포함하여 각 단계의 기본 UI가 표시됩니다.

문제: SQL Server에서 다른 노드로 마이그레이션한 후 네트워크에 로그온할 수 없습니다.

문제 1: SQL Server 서비스 계정에서 도메인 컨트롤러에 연결할 수 없습니다.

해결 방법 1: 어댑터 오류나 DNS 문제와 같은 네트워킹 문제가 있는지 이벤트 로그를 검사합니다. 도메인 컨트롤러를 ping할 수 있는지 확인합니다.

문제 2: SQL Server 서비스 계정 암호가 모든 클러스터 노드에서 동일하지 않거나 노드가 실패한 노드에서 마이그레이션된 SQL Server 서비스를 다시 시작하지 않습니다.

해결 방법 2: 구성 관리자를 사용하여 SQL Server 서비스 계정 암호를 변경합니다. 그렇지 않고 한 노드에서 SQL Server 서비스 계정 암호를 변경하는 경우 다른 모든 노드의 암호도 변경해야 합니다. 이 작업은 SQL Server 구성 관리자에 자동으로 수행합니다.

문제: SQL Server에서 클러스터 디스크에 액세스할 수 없음

문제 1: 펌웨어 또는 드라이버가 모든 노드에서 업데이트되지 않습니다.

해결 방법 1: 모든 노드가 올바른 펌웨어 버전과 동일한 드라이버 버전을 사용하고 있는지 확인합니다.

문제 2: 노드에서 라이브 문자가 다른 공유 클러스터 디스크의 실패한 노드로부터 마이그레이션된 클러스터 디스크를 복구할 수 없습니다.

해결 방법 2: 클러스터 디스크의 디스크 드라이브 문자는 두 서버 모두에서 동일해야 합니다. 그렇지 않은 경우 운영 체제 및 MSCS(Microsoft 클러스터 서비스)의 원래 설치를 검토합니다.

문제: SQL Server 서비스 오류로 인해 장애 조치(failover)가 발생

해결 방법: 특정 서비스 오류로 인해 SQL Server 그룹이 장애 조치(failover)되지 않도록 방지하려면 다음과 같이 Windows에서 클러스터 관리자를 사용하여 해당 서비스를 구성합니다.

  • 전체 텍스트 속성 대화 상자의 고급 탭에서 그룹에 영향 확인란을 선택 취소합니다. 그러나 SQL Server에서 장애 조치(failover)가 발생하면 전체 텍스트 검색 서비스가 다시 시작됩니다.

문제: SQL Server가 자동으로 시작되지 않음

해결 방법: MSCS의 클러스터 관리자를 사용하여 장애 조치(failover) 클러스터를 자동으로 시작합니다. SQL Server 서비스는 수동으로 시작되도록 설정해야 합니다. SQL Server 서비스를 시작하려면 MSCS에서 클러스터 관리자를 구성해야 합니다. 자세한 내용은 서비스 관리를 참조하세요.

문제: 네트워크 이름이 오프라인 상태이고 TCP/IP를 사용하여 SQL Server에 연결할 수 없습니다.

문제 1: DNS를 요구하도록 설정된 클러스터 리소스로 인해 DNS가 실패합니다.

해결 방법 1: DNS 문제를 해결합니다.

문제 2: 네트워크에 중복된 이름이 있습니다.

해결 방법 2: NBTSTAT를 사용하여 중복된 이름을 찾은 다음 문제를 해결합니다.

문제 3: SQL Server에서 명명된 파이프를 사용하여 연결하지 않습니다.

해결 방법 3: 명명된 파이프를 사용하여 연결하려면 SQL Server 구성 관리자를 사용하여 별칭을 만들고 이를 통해 적절한 컴퓨터에 연결합니다. 예를 들어 두 개의 노드(노드 A노드 B)가 있는 클러스터와 기본 인스턴스가 있는 장애 조치(failover) 클러스터 인스턴스(Virtsql)가 있는 경우 다음 단계를 사용하여 네트워크 이름 리소스가 있는 서버에 오프라인으로 연결할 수 있습니다.

  1. 클러스터 관리를 사용하여 SQL Server 인스턴스가 포함된 그룹이 실행되고 있는 노드를 확인합니다. 이 예에서는 노드 A입니다.

  2. net start를 사용하여 해당 컴퓨터에서 SQL Server 서비스를 시작합니다. net start를 사용하는 방법에 대한 자세한 내용은 SQL Server 수동 시작을 참조하세요.

  3. 노드 A에서 SQL Server SQL Server 구성 관리자를 시작합니다. 서버에서 수신 대기하고 있는 파이프 이름을 확인합니다. \\.\$$\VIRTSQL\pipe\sql\query와 비슷해야 합니다.

  4. 클라이언트 컴퓨터에서 SQL Server 구성 관리자를 시작합니다.

  5. 명명된 파이프를 통해 이 파이프 이름에 연결하는 별칭 SQLTEST1 만듭니다. 그러려면 노드 A를 서버 이름으로 입력하고 파이프 이름을 \\.\pipe\$$\VIRTSQL\sql\query로 편집합니다.

  6. 별칭 SQLTEST1 서버 이름으로 사용하여 이 인스턴스에 연결합니다.

문제: 11001 오류로 인해 SQL Server를 클러스터에 설치하지 못함

문제점: [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL.X\Cluster]에 고아 레지스트리 키가 있습니다.

해결 방법: MSSQL.X 레지스트리 하이브가 현재 사용하고 있지 않은지 확인한 다음, 클러스터 키를 삭제합니다.

문제: 클러스터 설치 오류가 발생합니다. "다음 디렉터리에 액세스할 수 있는 권한이 없습니다: <드라이브>\Microsoft SQL Server. 설치를 계속할 수 없습니다. 관리자 권한으로 로그온하거나 시스템 관리자에게 문의하세요."

문제: 이 오류는 제대로 분할되지 않은 SCSI 공유 드라이브로 인해 발생합니다.

해결 방법: 다음 단계를 사용하여 단일 파티션을 공유 디스크에 다시 만듭니다.

  1. 원본 클러스터에서 리소스를 삭제합니다.

  2. 디스크의 모든 파티션을 삭제합니다.

  3. 디스크 속성에서 해당 디스크가 기본 디스크인지 확인합니다.

  4. 공유 디스크에 파티션 한 개를 만들고 디스크를 포맷한 다음 디스크에 드라이브 문자를 할당합니다.

  5. 클러스터 관리자(cluadmin)를 사용하여 디스크를 클러스터에 추가합니다.

  6. SQL Server 설치 프로그램을 실행합니다.

문제: 애플리케이션에서 SQL Server 리소스를 분산 트랜잭션에 등록하지 못함

문제: MS DTC(Microsoft Distributed Transaction Coordinator)가 Windows에서 완전히 구성되지 않았으므로 애플리케이션에서 SQL Server 리소스를 분산 트랜잭션에 등록하지 못할 수 있습니다. 이 문제는 연결된 서버, 분산 쿼리 및 분산 트랜잭션을 사용하는 원격 저장 프로시저에 영향을 미칠 수 있습니다. MS DTC를 설치하는 방법에 대한 자세한 내용은 장애 조치(failover) 클러스터링을 설치하기 전에를 참조하세요.

해결 방법: 이러한 문제를 방지하려면 SQL Server가 설치되고 MS DTC가 구성된 서버에서 MS DTC 서비스를 완전히 사용하도록 설정해야 합니다.

MS DTC를 완전히 활성화하려면 다음 단계를 따르십시오.

  1. 제어판에서 관리 도구, 컴퓨터 관리를 차례로 엽니다.

  2. [컴퓨터 관리]의 왼쪽 창에서 서비스 및 애플리케이션을 확장한 다음. 서비스를 클릭합니다.

  3. [컴퓨터 관리]의 오른쪽 창에서 마우스 오른쪽 단추로 DTC(Distributed Transaction Coordinator)를 클릭하고, 속성을 선택합니다.

  4. 분산 트랜잭션 코디네이터 창에서 일반 탭을 클릭한 다음 중지를 클릭하여 서비스를 중지합니다.

  5. DTC(Distributed Transaction Coordinator) 창에서 로그온 탭을 클릭하고, NT AUTHORITY\NetworkService 로그온 계정을 설정합니다.

  6. 적용확인을 클릭하여 DTC(Distributed Transaction Coordinator) 창을 닫습니다. 컴퓨터 관리 창을 닫습니다. 관리 도구 창을 닫습니다.

확장 저장 프로시저 및 COM 개체 사용

장애 조치(failover) 클러스터링 구성이 있는 확장 저장 프로시저를 사용하는 경우 모든 확장 저장 프로시저를 SQL Server 종속 클러스터 디스크에 설치해야 합니다. 그러면 노드에서 장애 조치(Failover)를 수행할 때 확장 저장 프로시저를 계속 사용할 수 있습니다.

확장 저장 프로시저에서 COM 구성 요소를 사용하면 관리자는 COM 구성 요소를 클러스터의 각 노드에 등록해야 합니다. 구성 요소를 만들려면 COM 구성 요소를 로드하고 실행하기 위한 정보가 활성 노드의 레지스트리에 있어야 합니다. 그렇지 않으면 COM 구성 요소가 처음 등록된 컴퓨터의 레지스트리에 정보가 남아 있습니다.

참고 항목

SQL Server 설치 로그 파일 보기 및 읽기
확장 저장 프로시저 작동 원리
확장 저장 프로시저의 실행 특징