フェールオーバークラスターのトラブルシューティング

[アーティクル]
04/26/2023

適用対象:SQL Server

このトピックでは、次の問題について説明します。

基本的なトラブルシューティング手順
フェールオーバークラスター障害からの復旧
フェールオーバークラスタリングに関する一般的な問題の解決
拡張ストアドプロシージャおよび COM オブジェクトの使用

基本的なトラブルシューティング手順

診断の最初の手順では、新しいクラスターの検証チェックを実行します。検証の詳細については、「フェールオーバークラスターを作成する」のページの「構成の検証」を参照してください。これは、オンラインのクラスターリソースに影響しないため、サービスを中断することなく実行できます。フェールオーバークラスタリング機能をインストールしたら、クラスターの展開前、クラスターの作成中、クラスターの実行中を含め、いつでも検証を実行することができます。実際には、クラスターの使用中に、可用性の高いワークロードのベストプラクティスに従っているかどうかをチェックする追加テストも実行されます。数十回のテストのうち数回は、実行中のクラスターのワークロードに影響しますが、これらはすべてストレージカテゴリ内にあるため、このカテゴリ全体をスキップすると、簡単に中断を伴うテストを回避できます。
フェールオーバークラスタリングには、検証でストレージテストを実行する際の偶発的なダウンタイムを回避する組み込みのセーフガードが付属しています。検証の開始時にクラスターにオンライングループが含まれており、ストレージテストが選択されたままになっていると、すべてのテストを実行する (この場合、ダウンタイムが発生します) か、ダウンタイムを避けるためにすべてのオンライングループのディスクのテストをスキップするかを確認するプロンプトが表示されます。ストレージカテゴリ全体をテスト対象から除外すると、このプロンプトは表示されません。これにより、ダウンタイムなしのクラスターの検証が有効になります。

クラスターを再検証する方法

フェールオーバークラスタースナップインのコンソールツリーで、 [フェールオーバークラスター管理] が選択されていることを確認し、 [管理]の [構成の検証]をクリックします。
ウィザードの指示に従って、サーバーとテストを指定し、テストを実行します。テストの実行後、 [概要] ページが表示されます。
[概要] ページで [レポートの表示] をクリックしてテスト結果を表示します。

ウィザードを閉じた後にテスト結果を表示するには、 %SystemRoot%\Cluster\Reports\Validation Report date and time.html を参照してください。 %SystemRoot% はオペレーティングシステムがインストールされているフォルダーです (たとえば、 C:\Windows)。
結果の解釈に役立つヘルプトピックを表示するには、 [クラスター検証テストの詳細] をクリックします。

ウィザードを閉じた後にクラスター検証のヘルプトピックを表示するには、フェールオーバークラスタースナップインで [ヘルプ]、 [ヘルプトピック]、 [コンテンツ] タブの順にクリックし、フェールオーバークラスターヘルプのコンテンツを展開して、 [フェールオーバークラスター構成の検証]をクリックします。検証ウィザードが完了すると、 [概要レポート] に結果が表示されます。すべてのテスト結果が緑色のチェックマーク、または場合によっては黄色の三角形 (警告) になる必要があります。問題の領域 (赤色の X 印または黄色の疑問符) がないかどうかを調べるには、テスト結果を要約したレポートで個々のテストをクリックして、詳細を確認します。赤色の X 印の問題は、 SQL Server の問題のトラブルシューティングより前に解決する必要があります。

更新プログラムをインストールする

更新プログラムのインストールは、システムの問題を防ぐために重要です。役に立つリンク:

フェールオーバークラスター障害からの復旧

フェールオーバークラスター障害の一般的な原因は、次の 2 つのいずれかです。

2 ノードクラスターのいずれかのノードでハードウェア障害が発生しています。このハードウェア障害は、SCSI カードまたはオペレーティングシステムの障害によって発生する可能性があります。

この障害から復旧するには、 SQL Server セットアッププログラムを使用して、障害が発生したノードをフェールオーバークラスターから削除し、コンピューターをオフラインにしてハードウェアの障害を処置し、コンピューターを再び起動します。その後、修復されたノードをフェールオーバークラスターインスタンスに追加します。

詳細については、新しい SQL Server フェールオーバークラスターの作成 (セットアップ) に関するページおよび「フェールオーバークラスターインスタンス障害からの復旧」を参照してください。
オペレーティングシステムの障害が発生しています。このときノードはオフラインになりますが、復旧不可能なほどには破損していません。

オペレーティングシステムの障害から復旧するには、ノードを復旧してフェールオーバーをテストします。 SQL Server インスタンスのフェールオーバーが正しく行われない場合、 SQL Server セットアッププログラムを使用してフェールオーバークラスターから SQL Server を削除し、必要な修復を行い、コンピューターを再び起動します。その後、修復されたノードをフェールオーバークラスターインスタンスに追加する必要があります。

この方法でオペレーティングシステムの障害から復旧すると、時間がかかる場合があります。オペレーティングシステムの障害から簡単に復旧できる場合には、この方法は使用しないでください。

詳細については、新しい SQL Server フェールオーバークラスターの作成 (セットアップ) とフェールオーバークラスター障害のシナリオ 2 で復旧する方法に関するページを参照してください。

一般的な問題の解決

次に、一般的な使用上の問題とその解決策を示します。

問題: SQL Server をインストールするコマンドプロンプト構文の使用方法が正しくない

現象 1 : コマンドプロンプトで /qn スイッチを使用すると、 /qn スイッチによりセットアップのダイアログボックスとエラーメッセージが表示されなくなるため、セットアップの問題を診断することが難しくなります。 /qn スイッチを指定すると、エラーメッセージを含むすべてのセットアップメッセージがセットアップログファイルに書き込まれます。ログファイルの詳細については、「 SQL Server セットアップログファイルの表示と読み取り」を参照してください。

解決策 1: /qn スイッチの代わりに /qb スイッチを使用します。 /qb スイッチを使用すると、各ステップでは、エラーメッセージなどの基本的な UI が表示されます。

問題: SQL Server を別のノードに移行した後、ネットワークにログオンできない

現象 1: SQL Server サービスアカウントがドメインコントローラーと通信できません。

解決策 1: アダプターの障害や DNS の問題など、ネットワークに関する問題の兆候をイベントログで確認します。ドメインコントローラーに対して ping を実行できることを確認します。

現象 2: SQL Server サービスアカウントのパスワードがすべてのクラスターノードで同一でないか、障害が発生したノードから移行した SQL Server サービスがノードで再起動されません。

解決策 2: SQL Server 構成マネージャーを使用して SQL Server サービスアカウントのパスワードを変更します。この操作を行わず、1 つのノードで SQL Server サービスアカウントのパスワードを変更した場合、他のすべてのノードでもパスワードを変更する必要があります。 SQL Server 構成マネージャーを使用すると、この操作が自動的に行われます。

問題: SQL Server がクラスターディスクにアクセスできない

問題点 1: すべてのノードのファームウェアまたはドライバーが更新されていません。

解決策 1: すべてのノードで正しいファームウェアのバージョンおよび同じドライバーのバージョンを使用していることを確認します。

現象 2 : ドライブ文字が異なる共有クラスターディスクで、障害が発生したノードから移行したクラスターディスクを復旧できません。

解決策 2: クラスターディスクのディスクドライブ文字は、両方のサーバーで同じである必要があります。同じでない場合は、オペレーティングシステムおよび MSCS ( Microsoft Cluster Service) の初期のインストール状態を確認してください。

問題: SQL Server サービスの障害によりフェールオーバーが発生する

解決策 : 特定のサービスの障害による SQL Server グループのフェールオーバーを回避するには、Windows のクラスターアドミニストレーターを使用してサービスを次のように構成します。

[フルテキストのプロパティ] ダイアログボックスの [詳細設定] タブで、 [グループに適用する] チェックボックスをオフにします。ただし、 SQL Server によりフェールオーバーが発生した場合は、フルテキスト検索サービスが再起動します。

問題: SQL Server が自動的に起動しない

解決策: フェールオーバークラスターを自動的に起動するには、MSCS でクラスターアドミニストレーターを使用します。 SQL Server サービスは手動で開始するように設定されています。クラスターアドミニストレーターは MSCS で SQL Server サービスを開始するように構成されています。詳細については、「サービスの管理」を参照してください。

問題: ネットワーク名がオフラインで、SQL Server に TCP/IP で接続できない

問題点 1: DNS 必須に設定されているクラスターリソースで DNS が失敗します。

解決策 1: DNS の問題を修正します。

問題点 2: ネットワーク上に重複する名前があります。

解決策 2: NBTSTAT を使用して重複する名前を検索し、問題を修正します。

現象 3: SQL Server の接続に名前付きパイプが使用されていません。

解決策 3: 名前付きパイプで接続するには、SQL Server 構成マネージャーを使用して別名を作成し、適切なコンピューターに接続します。たとえば、2 つのノード (Node A および Node B) から成るクラスター、および既定のインスタンスを使用するフェールオーバークラスターインスタンス (Virtsql) がある場合、次の手順に従って、オフラインのネットワーク名リソースがあるサーバーに接続できます。

クラスターアドミニストレーターを使用して、 SQL Server インスタンスを含むグループが実行されているノードを特定します。この例では、 Node Aです。
SQL Server net start を使用して、そのコンピューターのサービスを開始します。 net startの使用方法については、「手動による SQL Server の起動」を参照してください。
Node A で SQL Server SQL Server 構成マネージャーを起動します。サーバーがリッスンしているパイプ名を確認します。パイプ名は \\.\$$\VIRTSQL\pipe\sql\query のように表示されます。
クライアントコンピューターで、SQL Server 構成マネージャーを起動します。
"SQLTEST1" という別名を作成し、名前付きパイプ経由でこのパイプ名に接続します。これを行うには、サーバー名として「Node A」と入力し、パイプ名を編集して \\.\pipe\$$\VIRTSQL\sql\query とします。
別名 SQLTEST1 をサーバー名として使用して、このインスタンスに接続します。

問題: クラスターでエラー 11001 が発生して SQL Server セットアップが失敗する

問題: [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL.X\Cluster] に孤立したレジストリキーがあります。

解決策: MSSQL.X レジストリハイブが使用中でないことを確認し、クラスターキーを削除します。

問題: クラスターセットアップエラー: "インストーラーにはディレクトリ <drive>\Microsoft SQL Server にアクセスするための十分な特権がありません。インストールを続行できません。管理者としてログオンするか、またはシステム管理者に問い合わせてください。" が発生する

問題: このエラーは SCSI 共有ドライブのパーティションが適切に分割されていないために発生します。

解決策: 次の手順に従って、共有ディスクに単一のパーティションを再作成します。

クラスターからディスクリソースを削除します。
ディスクのすべてのパーティションを削除します。
ディスクのプロパティで、ディスクが基本ディスクになっていることを確認します。
共有ディスクにパーティションを 1 つ作成し、ディスクをフォーマットして、ドライブ文字を割り当てます。
クラスターアドミニストレーター (cluadmin) を使用してディスクをクラスターに追加します。
SQL Server セットアップを実行します。

問題: アプリケーションで SQL Server リソースを分散トランザクションに参加させることができない

現象 : MS DTC ( Microsoft 分散トランザクションコーディネーター) が Windows で完全に構成されていないために、アプリケーションから SQL Server リソースを分散トランザクションに参加させることができない場合があります。この問題は、分散トランザクションを使用するリンクサーバー、分散クエリ、およびリモートストアドプロシージャに影響することがあります。 MS DTC を構成する方法の詳細については、「 Before Installing Failover Clustering」を参照してください。

解決策: このような問題を回避するには、SQL Server をインストールして MS DTC を構成したサーバーで、MS DTC サービスを完全に有効にする必要があります。

MS DTC を完全に有効にするには、次の手順を実行します。

コントロールパネルで、 [管理ツール] を開き、 [コンピューターの管理] を開きます。
[コンピューターの管理] の左ペインで、 [サービスとアプリケーション] を展開し、 [サービス] をクリックします。
[コンピューターの管理] の右ペインで、 [Distributed Transaction Coordinator] を右クリックし、 [プロパティ] をクリックします。
[Distributed Transaction Coordinator のプロパティ] ウィンドウで [全般] タブをクリックし、 [停止] をクリックしてサービスを停止します。
[Distributed Transaction Coordinator のプロパティ] ウィンドウで [ログオン] タブをクリックし、ログインアカウント NT AUTHORITY\NetworkService を設定します。
[適用] をクリックして [OK] をクリックし、 [分散トランザクションコーディネーター] ウィンドウを閉じます。 [コンピューターの管理] ウィンドウを閉じます。 [管理ツール] ウィンドウを閉じます。

拡張ストアドプロシージャおよび COM オブジェクトの使用

フェールオーバークラスタリング構成で拡張ストアドプロシージャを使用する場合、 SQL Serverに依存するクラスターディスク上にすべての拡張ストアドプロシージャをインストールする必要があります。これは、ノードがフェールオーバーしても拡張ストアドプロシージャを使用できるようにするためです。

拡張ストアドプロシージャで COM コンポーネントが使用される場合、管理者はその COM コンポーネントをクラスター内の各ノードに登録する必要があります。 COM コンポーネントを作成するには、COM コンポーネントを読み込んで実行するための情報をアクティブなノードのレジストリに格納する必要があります。この場所に格納しないと、その情報は COM コンポーネントを最初に登録したコンピューターのレジストリに残ります。

参照

SQL Server セットアップログファイルの表示と読み取り
 拡張ストアドプロシージャのしくみ
 拡張ストアドプロシージャの実行における特性

フェールオーバークラスターのトラブルシューティング

基本的なトラブルシューティング手順

クラスターを再検証する方法

フェールオーバークラスター障害からの復旧

一般的な問題の解決

問題: SQL Server をインストールするコマンドプロンプト構文の使用方法が正しくない

問題: SQL Server を別のノードに移行した後、ネットワークにログオンできない

問題: SQL Server がクラスターディスクにアクセスできない

問題: SQL Server サービスの障害によりフェールオーバーが発生する

問題: SQL Server が自動的に起動しない

問題: ネットワーク名がオフラインで、SQL Server に TCP/IP で接続できない

問題: クラスターでエラー 11001 が発生して SQL Server セットアップが失敗する

問題: アプリケーションで SQL Server リソースを分散トランザクションに参加させることができない

拡張ストアドプロシージャおよび COM オブジェクトの使用

参照

フィードバック

フィードバック

その他のリソース

フェールオーバー クラスターのトラブルシューティング

基本的なトラブルシューティング手順

クラスターを再検証する方法

フェールオーバー クラスター障害からの復旧

一般的な問題の解決

問題: SQL Server をインストールするコマンド プロンプト構文の使用方法が正しくない

問題: SQL Server を別のノードに移行した後、ネットワークにログオンできない

問題: SQL Server がクラスター ディスクにアクセスできない

問題: SQL Server サービスの障害によりフェールオーバーが発生する

問題: SQL Server が自動的に起動しない

問題: ネットワーク名がオフラインで、SQL Server に TCP/IP で接続できない

問題: クラスターでエラー 11001 が発生して SQL Server セットアップが失敗する

問題: アプリケーションで SQL Server リソースを分散トランザクションに参加させることができない

拡張ストアド プロシージャおよび COM オブジェクトの使用

参照

フィードバック

フィードバック

その他のリソース

フェールオーバークラスターのトラブルシューティング

フェールオーバークラスター障害からの復旧

問題: SQL Server をインストールするコマンドプロンプト構文の使用方法が正しくない

問題: SQL Server がクラスターディスクにアクセスできない

拡張ストアドプロシージャおよび COM オブジェクトの使用