フェールオーバーとフェールオーバーモード (AlwaysOn 可用性グループ)

[アーティクル]
04/26/2023

適用対象:SQL Server

一般的に、可用性グループのコンテキスト内で、可用性レプリカのプライマリロールとセカンダリロールが フェールオーバーと呼ばれるプロセスで交換されることがあります。フェールオーバーには、自動フェールオーバー (データ損失なし)、計画的な手動フェールオーバー (データ損失なし)、および " 強制フェールオーバー" と通常呼ばれる強制手動フェールオーバー (データ損失の可能性あり) の 3 つの形式があります。自動フェールオーバーと計画的な手動フェールオーバーでは、すべてのデータが保持されます。可用性グループは、可用性レプリカのレベルでフェールオーバーします。つまり、可用性グループはセカンダリレプリカのいずれか (現在の " フェールオーバーターゲット") にフェールオーバーされます。

Note

データベースレベルの正常性検出を構成していない限り、データベースレベルの問題 (データファイルの損失、データベースの削除、トランザクションログの破損による障害が疑われる場合など) が発生しても、可用性グループのフェールオーバーは行われません。

フェールオーバーによってフェールオーバーターゲットがプライマリロールを引き継ぎ、そのデータベースを復旧し、新しいプライマリデータベースとしてオンラインにします。元のプライマリレプリカは使用可能になるとセカンダリロールに切り替わり、そのデータベースがセカンダリデータベースになります。場合によっては、複数のエラーに対する対応として、または管理目的のために、これらのロールを何度も交代できます (または、別のフェールオーバーターゲットに切り替えることができます)。

特定の可用性レプリカがサポートするフェールオーバーの形式は、" フェールオーバーモード " プロパティで指定されます。可用性レプリカの有効なフェールオーバーモードは、次のようにそのレプリカの可用性モードによって異なります。

同期コミットレプリカ: 自動と手動の 2 つの設定をサポートします。 "自動" 設定では、自動フェールオーバーと手動フェールオーバーの両方をサポートしています。データの損失を回避するために、自動フェールオーバーおよび計画的なフェールオーバーでは、フェールオーバーターゲットが正常な同期状態を持つセカンダリレプリカを同期コミットします (これは、フェールオーバーターゲット上のすべてのセカンダリデータベースが対応するプライマリデータベースと同期されることを表します)。セカンダリレプリカがどちらの条件も満たさない場合は、強制フェールオーバーのみがサポートされます。ロールが RESOLVING 状態であるレプリカでも強制フェールオーバーがサポートされていることに注意してください。
非同期コミットレプリカ: 手動フェールオーバーモードのみをサポートします。また、同期されないため、強制フェールオーバーのみをサポートします。

Note

フェールオーバー後、プライマリデータベースにアクセスする必要があるクライアントアプリケーションは、新しいプライマリレプリカに接続する必要があります。また、新しいセカンダリレプリカが読み取り専用アクセスを許可するように構成されている場合は、読み取り専用クライアントアプリケーションから接続できます。可用性グループリスナーの詳細については、「可用性グループリスナー、クライアント接続、およびアプリケーションのフェールオーバー (SQL Server)」をご覧ください。

このトピックのセクション:

用語と定義
フェールオーバーの概要
自動フェールオーバー
計画的な手動フェールオーバー (データ損失なし)
強制フェールオーバー (データ損失の可能性あり)
関連タスク
関連コンテンツ

用語と定義

自動フェールオーバー
プライマリレプリカの喪失によって自動的に発生するフェールオーバー。自動フェールオーバーは、現在のプライマリレプリカと 1 つのセカンダリレプリカのフェールオーバーモードがどちらも AUTOMATIC に設定され、セカンダリレプリカが現在同期されている場合のみサポートされます。プライマリレプリカまたはセカンダリレプリカのフェールオーバーモードが MANUAL に設定されている場合、自動フェールオーバーは実行されません。

計画的な手動フェールオーバー (データ損失なし)
計画的な手動フェールオーバーまたは " 手動フェールオーバー" は、一般的に管理目的でデータベース管理者によって開始されるフェールオーバーです。計画的な手動フェールオーバーは、プライマリレプリカとセカンダリレプリカの両方に同期コミットモードが構成され、プライマリレプリカとセカンダリレプリカがどちらも現在同期されている (SYNCHRONIZED 状態になっている) 場合にのみサポートされます。対象のセカンダリレプリカが同期されているときは、セカンダリデータベースでフェールオーバーの準備が整っているため、プライマリレプリカがクラッシュした場合でも手動フェールオーバー (データ損失なし) を実行できます。データベース管理者は手動フェールオーバーを手動で開始します。

強制フェールオーバー (データ損失の可能性あり)
プライマリレプリカに同期されている (SYNCHRONIZED 状態の) セカンダリレプリカがない場合、またはプライマリレプリカが実行されていないためにセカンダリレプリカでフェールオーバーの準備が整っていない場合に、データベース管理者が開始できるフェールオーバー。強制フェールオーバーはデータを損失する可能性があるため、ディザスターリカバリーにのみ使用することをお勧めします。強制フェールオーバーは、手動のみで開始できるため、強制手動フェールオーバーとも呼ばれます。これは、非同期コミット可用性モードでサポートされているフェールオーバーの唯一の形式です。

自動フェールオーバーセット

指定された可用性グループ内で、自動フェールオーバーが指定された同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 可用性レプリカのペア。自動フェールオーバーセットは、セカンダリレプリカがプライマリレプリカとの間で現在 SYNCHRONIZED 状態にある場合のみ有効です。

同期コミットフェールオーバーセット

指定された可用性グループ内で、同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 2 つまたは 3 つの可用性レプリカのセット。同期コミットフェールオーバーセットは、セカンダリレプリカに手動フェールオーバーモードが構成され、1 つ以上のセカンダリレプリカとプライマリレプリカが現在 SYNCHRONIZED 状態にある場合のみ有効です。

全フェールオーバーセット

指定された可用性グループ内で、可用性モードおよびフェールオーバーモードに関係なく、現在の操作状態が ONLINE であるすべての可用性レプリカのセット。全フェールオーバーセットは、現在プライマリレプリカと SYNCHRONIZED 状態になっているセカンダリレプリカがない場合に有効です。

フェールオーバーの概要

次の表に、各種の可用性モードおよびフェールオーバーモードでサポートされるフェールオーバーの形式をまとめます。それぞれの組み合わせについて、プライマリレプリカのモードと 1 つまたは複数のセカンダリレプリカのモードとが交差する部分から、有効な可用性モードおよびフェールオーバーモードを判定できます。

フェールオーバーの形式	非同期コミットモード	手動フェールオーバーモードを指定した同期コミットモード	自動フェールオーバーを指定した同期コミットモード
自動フェールオーバー	いいえ	いいえ	はい
計画的な手動フェールオーバー	いいえ	はい	はい
強制フェールオーバー	はい	はい	はい*****

*****同期されたセカンダリレプリカ上で強制フェールオーバーコマンドを実行した場合、セカンダリレプリカは手動フェールオーバーの場合と同様に動作します。

フェールオーバー中にデータベースが使用できなくなる時間の長さは、フェールオーバーの種類および原因によって異なります。

重要

フェールオーバー後もクライアント接続をサポートするには、これまでのすべてのプライマリデータベースで定義されたログインおよびジョブを新しいプライマリデータベースに手動で再作成する必要があります (ただし、包含データベースは例外)。詳しくは、「可用性グループのデータベースのためのログインとジョブの管理 (SQL Server)」をご覧ください。

フェールオーバーセット

特定の可用性グループで可能なフェールオーバーの形式は、フェールオーバーセットの観点から理解できます。フェールオーバーセットは、次のようにフェールオーバーの特定の形式をサポートするプライマリレプリカとセカンダリレプリカで構成されています。

自動フェールオーバーセット (省略可能): 指定された可用性グループ内で、自動フェールオーバーが指定された同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 可用性レプリカのペア。自動フェールオーバーセットは、セカンダリレプリカがプライマリレプリカとの間で現在 SYNCHRONIZED 状態にある場合のみ有効です。
同期コミットフェールオーバーセット (省略可能): 指定された可用性グループ内で、同期コミットモード (存在する場合) が構成されている、(現在のプライマリレプリカを含む) 2 つまたは 3 つの可用性レプリカのセット。同期コミットフェールオーバーセットは、セカンダリレプリカに手動フェールオーバーモードが構成され、1 つ以上のセカンダリレプリカとプライマリレプリカが現在 SYNCHRONIZED 状態にある場合のみ有効です。
全フェールオーバーセット: 指定された可用性グループ内で、可用性モードおよびフェールオーバーモードに関係なく、現在の操作状態が ONLINE であるすべての可用性レプリカのセット。全フェールオーバーセットは、現在プライマリレプリカと SYNCHRONIZED 状態になっているセカンダリレプリカがない場合に有効です。

可用性レプリカに、自動フェールオーバーが指定された同期コミットモードを構成した場合、可用性レプリカは自動フェールオーバーセットの一部になります。ただし、セットが有効になるかどうかは、現在のプライマリに依存します。指定された時刻に実際に可能なフェールオーバーの形式は、現在有効なフェールオーバーセットによって決まります。

たとえば、次に示す 4 つの可用性レプリカを持つ可用性グループについて考えてみましょう。

[レプリカ]	可用性モードとフェールオーバーモードの設定
A	同期コミットモードで自動フェールオーバーを指定
B	同期コミットモードで自動フェールオーバーを指定
C	同期コミットモードで計画的な手動フェールオーバーのみを指定
D	非同期コミットモード (強制フェールオーバーのみを指定)

各セカンダリレプリカのフェールオーバーの動作は、現在どの可用性レプリカがプライマリレプリカであるかによって異なります。基本的には、特定のセカンダリレプリカにおけるフェールオーバーの動作は、現在のプライマリレプリカに想定される最悪のケースに対応します。次の図は、セカンダリレプリカのフェールオーバー動作が現在のプライマリレプリカに応じてどのように変化するか、また、非同期コミットモード (強制フェールオーバーのみ使用) と同期コミットモード (自動フェールオーバーを使用する場合と使用しない場合があります) のどちらで構成されているかを示します。

プライマリレプリカ構成がフェールオーバーに与える影響

自動フェールオーバー

自動フェールオーバーでは、プライマリレプリカが使用できなくなった後で、対応するセカンダリレプリカが自動的にプライマリロールに移行します。セカンダリレプリカをホストするノードに対して、プライマリレプリカをホストする WSFC ノードがローカルである場合、自動フェールオーバーが最適です。これには、データ同期はコンピューター間のメッセージ待機時間が短いときに最も効果的であること、およびクライアント接続をローカルに保持できるという理由があります。

このセクションの内容

自動フェールオーバーに必要な条件
自動フェールオーバーの動作
自動フェールオーバーを有効にするには

自動フェールオーバーに必要な条件

自動フェールオーバーは、以下の条件が満たされた場合のみ発生します。

自動フェールオーバーセットが存在する。このセットはプライマリレプリカとセカンダリレプリカ (" 自動フェールオーバーターゲット") で構成され、プライマリレプリカとセカンダリレプリカは両方とも同期コミットモードで構成され、どちらも AUTOMATIC フェールオーバーに設定されています。プライマリレプリカが MANUAL フェールオーバーに設定されている場合、セカンダリレプリカが AUTOMATIC フェールオーバーに設定されていても、自動フェールオーバーは行われません。

詳細については、「可用性モード (Always On 可用性グループ)」を参照してください。
自動フェールオーバーターゲットの同期状態が正常である (これは、フェールオーバーターゲットのすべてのセカンダリデータベースが、対応するプライマリデータベースと同期されていることを意味します)。

ヒント

AlwaysOn 可用性グループでは、自動フェールオーバーセットの両方のレプリカの状態を監視します。いずれかのレプリカが失敗した場合、可用性グループの正常性状態が CRITICAL に設定されます。セカンダリレプリカが失敗した場合、自動フェールオーバーターゲットは使用できないため、自動フェールオーバーは実行されません。プライマリレプリカが失敗した場合、可用性グループはセカンダリレプリカにフェールオーバーします。元のプライマリレプリカがオンラインになるまで、自動フェールオーバーターゲットは存在しません。どちらの場合でも、可用性を確保し、連続して失敗する可能性が低くなるように、別のセカンダリレプリカを自動フェールオーバーターゲットとして構成することをお勧めします。

詳細については、「Always On ポリシーを使用した可用性グループの正常性の確認 (SQL Server)」と「可用性レプリカのフェールオーバーモードの変更 (SQL Server)」を参照してください。
Windows Server フェールオーバークラスタリング (WSFC) クラスターにクォーラムがある。詳細については、「 WSFC クォーラムモードと投票の構成 (SQL Server)」をご覧ください。
プライマリレプリカが使用できなくなり、柔軟なフェールオーバーポリシーにより定義されたフェールオーバー条件レベルが満たされている。フェールオーバー条件レベルの詳細については、「可用性グループの自動フェールオーバーのための柔軟なフェールオーバーポリシー (SQL Server)」を参照してください。

自動フェールオーバーの動作

自動フェールオーバーにより、次の一連の操作が開始されます。

現在のプライマリレプリカをホストするサーバーインスタンスがまだ実行中の場合は、プライマリデータベースの状態が DISCONNECTED に変更され、すべてのクライアントが切断されます。
対象のセカンダリレプリカの復旧キューで待機中のログレコードがある場合、セカンダリレプリカはそのログレコードを適用してセカンダリデータベースのロールフォワードを終了します。

Note

特定のデータベースにログを適用するために必要な時間は、システムの処理速度、直近の作業負荷、および復旧キュー内のログの量によって異なります。
元のセカンダリレプリカはプライマリロールに移行します。そのデータベースがプライマリデータベースになります。新しいプライマリレプリカによって、コミットされていないすべてのトランザクションが迅速にロールバックされます (復旧の元に戻すフェーズ)。これらのコミットされていないトランザクションがロックによって分離されるため、クライアントがデータベースを使用している間にバックグラウンドでロールバックを行うことができます。このプロセスでは、コミット済みのトランザクションはロールバックされません。

特定のセカンダリデータベースが接続されるまでの短い間、NOT_SYNCHRONIZED としてマークされます。ロールバックの復旧が開始される前、セカンダリデータベースは、新しいプライマリデータベースに接続し、即座に SYNCHRONIZED 状態に移行できます。一番問題のないケースは、フェールオーバー後もセカンダリロールを維持する 3 番目の同期コミットレプリカです。
元のプライマリレプリカをホストしているサーバーインスタンスが後で再起動されると、別の可用性レプリカが新たにプライマリロールを所有していることが認識されます。元のプライマリレプリカはセカンダリロールに移行し、そのデータベースがセカンダリデータベースになります。新しいセカンダリレプリカは現在のプライマリレプリカに接続し、可能な限り早期にそのデータベースを現在のプライマリデータベースに同期します。新しいセカンダリレプリカのデータベースの再同期が完了すると、その時点から、反対方向のフェールオーバーを実行できるようになります。

自動フェールオーバーを設定するには

任意の時点で、可用性レプリカが自動フェールオーバーをサポートするように構成できます。

自動フェールオーバーを設定するには

セカンダリレプリカが、同期コミット可用性モードを使用するように構成されていることを確認します。詳細については、「可用性レプリカの可用性モードの変更 (SQL Server)」を参照してください。
フェールオーバーモードを自動に設定します。詳細については、「可用性レプリカのフェールオーバーモードの変更 (SQL Server)」を参照してください。
必要に応じて、可用性グループの柔軟なフェールオーバーポリシーを変更して、自動フェールオーバーを発生させる障害の種類を指定します。詳細については、「自動フェールオーバーの条件を制御する柔軟なフェールオーバーポリシーの構成 (Always On 可用性グループ)」と「フェールオーバークラスターインスタンスのフェールオーバーポリシー」を参照してください。

計画的な手動フェールオーバー (データ損失なし)

対象のセカンダリレプリカがホストされているサーバーインスタンスでデータベース管理者が手動フェールオーバーコマンドを発行すると、同期済みのセカンダリレプリカがプライマリロールに移行します。手動フェールオーバーをサポートするには、セカンダリレプリカと現在のプライマリレプリカの両方に同期コミットモード (存在する場合) が構成されている必要があります。可用性レプリカのすべてのセカンダリデータベースが可用性グループに参加し、その対応するプライマリデータベースに同期されている必要があります (つまり、セカンダリレプリカを同期する必要があります)。これにより、元のプライマリデータベースでコミットされていたトランザクションもすべて新しいプライマリデータベースに確実にコミットされます。したがって、新しいプライマリデータベースは、古いプライマリデータベースと同じです。

次の図に、計画的なフェールオーバーの段階を示します。

フェールオーバーの前、プライマリレプリカは Node01のサーバーインスタンスによってホストされています。
データベース管理者によって計画的なフェールオーバーが開始されます。フェールオーバーターゲットは、 Node02のサーバーインスタンスによってホストされている可用性レプリカです。
( Node02上の) フェールオーバーターゲットが新しいプライマリレプリカになります。これは計画的なフェールオーバーであるため、フェールオーバー中に元のプライマリレプリカはセカンダリロールに切り替わり、そのデータベースをセカンダリデータベースとして即座にオンラインにします。

計画的な手動フェールオーバーの図

このセクションの内容

手動フェールオーバーに必要な条件
手動フェールオーバーの動作
アップグレード中の可用性の維持

手動フェールオーバーに必要な条件

手動フェールオーバーをサポートするには、現在のプライマリレプリカに同期コミットモードが設定され、セカンダリレプリカが次の条件を満たす必要があります。

同期コミットモードが構成されている。
現在、プライマリレプリカと同期されている。

可用性グループのフェールオーバーを手動で実行するには、新しいプライマリレプリカになるセカンダリレプリカに接続する必要があります。

計画的な手動フェールオーバーの動作

計画的な手動フェールオーバーは、対象のセカンダリレプリカで開始する必要があります。計画的な手動フェールオーバーによって次の処理シーケンスが開始されます。

新しいユーザートランザクションが元のプライマリデータベースで発生しないようにするために、WSFC クラスターがプライマリレプリカをオフラインにする要求をプライマリレプリカに送信します。
セカンダリデータベースの復旧キューで待機中のログがある場合は、セカンダリレプリカで、そのセカンダリデータベースのロールフォワードが終了されます。必要な時間は、システムの処理速度、最近の作業負荷、および復旧キューのログの量によって異なります。復旧キューの現在のサイズを調べるには、 Recovery Queue パフォーマンスカウンターを使用します。詳細については、「 SQL Server、Database Replica」を参照してください。

Note

復旧キューのサイズを制限することでフェールオーバーの時間を調節できます。ただし、セカンダリレプリカの遅れを取り戻すためにプライマリレプリカの処理速度が低下する場合があります。
セカンダリレプリカは新しいプライマリレプリカになり、元のプライマリレプリカは新しいセカンダリレプリカになります。
新しいプライマリレプリカでは、コミットされていないトランザクションがすべてロールバックされ、そのデータベースがプライマリデータベースとしてオンラインになります。すべてのセカンダリデータベースは、新しいプライマリデータベースに接続されて再同期されるまでの短い間、NOT SYNCHRONIZED としてマークされます。このプロセスでは、コミット済みのトランザクションはロールバックされません。
元のプライマリレプリカはオンラインになるとセカンダリロールを引き継ぎ、元のプライマリデータベースがセカンダリデータベースになります。新しいセカンダリレプリカによって、新しいセカンダリデータベースが対応するプライマリデータベースと迅速に再同期されます。

Note

新しいセカンダリレプリカのデータベースの再同期が完了すると、その時点から、反対方向のフェールオーバーを実行できるようになります。

フェールオーバー後は、クライアントから現在のプライマリデータベースに再接続する必要があります。詳細については、可用性グループリスナー、クライアント接続、およびアプリケーションのフェールオーバー (SQL Server) に関するページを参照してください。

アップグレード中の可用性の維持

可用性グループのデータベース管理者は、手動フェールオーバーを使用することにより、ハードウェアまたはソフトウェアのアップグレード時にデータベースの可用性を維持できます。ソフトウェアアップグレードのために可用性グループを使用するには、対象のセカンダリレプリカがホストされているサーバーインスタンスまたはコンピューターノードでアップグレードが受信済みである必要があります。詳細については、「 AlwaysOn 可用性グループのレプリカインスタンスのアップグレード」を参照してください。

強制フェールオーバー (データ損失の可能性あり)

可用性グループの強制フェールオーバー (データ損失の可能性あり) は、セカンダリレプリカをウォームスタンバイサーバーとして使用できるディザスターリカバリー方法です。フェールオーバーを強制するとデータを損失する可能性があるので、強制フェールオーバーは注意深く慎重に使用してください。可用性データベースにサービスをすぐに復元する必要があり、データの損失を許容できる場合に限り、フェールオーバーを強制することをお勧めします。強制フェールオーバーを実行するための前提条件と推奨事項の詳細、および強制フェールオーバーを使用して重大なエラーから復旧するサンプルシナリオについては、このトピックの「可用性グループの強制手動フェールオーバーの実行 (SQL Server)」を参照してください。

警告

強制フェールオーバーでは、WSFC クラスターにクォーラムが必要です。クォーラム構成とクォーラムの強制の詳細については、「Windows Server フェールオーバークラスタリング (WSFC) と SQL Server」を参照してください。

このセクションの内容

強制フェールオーバーの動作
強制フェールオーバーのリスク
クォーラムの強制後に強制フェールオーバーが必要な理由
データ損失の可能性の追跡
データ損失の可能性への対処

強制フェールオーバーの動作

フェールオーバーを強制すると、ロールが SECONDARY 状態または RESOLVING 状態であるターゲットレプリカにプライマリロールが移行されます。フェールオーバーターゲットは、新しいプライマリレプリカになり、クライアントは直ちにデータベースのコピーを利用できるようになります。元のプライマリレプリカは使用可能になるとセカンダリロールに移行し、そのデータベースはセカンダリデータベースになります。

すべてのセカンダリデータベース (元のプライマリデータベースが使用可能になった場合は、そのプライマリデータベースを含む) が SUSPENDED 状態になります。中断状態のセカンダリデータベースの以前のデータ同期状態に応じて、そのプライマリデータベースの損失したコミットデータを復旧することが適切な場合があります。読み取り専用アクセス用に構成されたセカンダリレプリカで、セカンダリデータベースのクエリを実行して、損失したデータを手動で検出できます。次に、新しいプライマリデータベースで Transact-SQL ステートメントを発行して、必要な変更を加えることができます。

強制フェールオーバーのリスク

フェールオーバーの強制によってデータが失われる可能性があることを理解しておく必要があります。ターゲットレプリカがプライマリレプリカと通信できなくなり、そのためにデータベースが必ずしも同期されなくなることが原因で、データが失われる可能性があります。フェールオーバーを強制すると、新しい復旧分岐が始まります。元のプライマリデータベースとセカンダリデータベースは別の復旧分岐に存在するので、それぞれのデータベースにはもう一方のデータベースには含まれていないデータが含まれることになります。つまり、それぞれの元のプライマリデータベースにはその送信キューから前のセカンダリデータベースに送信されなかったすべての変更 (未送信ログ) が含まれ、前のセカンダリデータベースには、フェールオーバーの強制後に行われたすべての変更が含まれます。

プライマリレプリカで障害が発生したためにフェールオーバーが強制された場合、データ損失があるかどうかは、障害発生前にセカンダリレプリカに送信されたトランザクションログがあるかどうかによって異なります。非同期コミットモードの場合、蓄積された未送信ログがある場合は常にデータ損失の可能性があります。同期コミットモードの場合、この可能性があるのは、セカンダリデータベースが同期された状態になるまでの間だけです。

次の表に、フェールオーバーを強制するレプリカ上の特定のデータベースでのデータ損失の可能性をまとめます。

セカンダリレプリカの可用性モード	データベースが同期しているか	データが失われる可能性があるか
同期コミット	はい	いいえ
同期コミット	いいえ	はい
非同期コミット	いいえ	はい

セカンダリデータベースは 2 つの復旧分岐のみを追跡するため、複数の強制フェールオーバーを実行した場合、前の強制フェールオーバーでデータの同期を開始しなかったセカンダリデータベースは再開できない場合があります。この場合は、再開できないセカンダリデータベースを可用性グループから削除して、適切な時点まで復元した後で再度可用性グループに参加させる必要があります。このシナリオでは、状態 103 のエラー 1408 が発生する可能性があります (エラー: 1408、重大度: 16、状態: 103)。復元は複数の復旧分岐に対しては機能しないため、複数の強制フェールオーバーを実行した後に必ずログバックアップを実行してください。

クォーラムの強制後に強制フェールオーバーが必要な理由

WSFC クラスターでクォーラムが強制された後 ("強制クォーラム")、各可用性グループで強制フェールオーバー (データ損失の可能性あり) を実行する必要があります。強制フェールオーバーが必要なのは、WSFC クラスター値の実際の状態が失われている可能性があるためです。再構成された WSFC クラスターで非同期のセカンダリレプリカが同期されたように見える可能性があるため、強制クォーラムの後に通常のフェールオーバーが実行されるのを防ぐ必要があります。

たとえば、3 つのノードで可用性グループをホストする WSFC クラスターについて考えてみます。ノード A はプライマリレプリカをホストし、ノード B とノード C はそれぞれセカンダリレプリカをホストします。ノード C は、ローカルセカンダリレプリカが SYNCHRONIZED 状態の間に WSFC クラスターから切断されます。ただし、ノード A とノード B では正常なクォーラムが保持され、可用性グループはオンラインのままになります。ノード A では、プライマリレプリカが引き続き更新を受け入れ、ノード B では、セカンダリレプリカが引き続きプライマリレプリカと同期されます。ノード C のセカンダリレプリカは同期されなくなり、プライマリレプリカからしだいに遅れが生じます。ただし、ノード C は切断されているため、レプリカは誤って SYNCHRONIZED 状態のままになります。

ノード A でクォーラムが失われた後に強制された場合は、WSFC クラスター上の可用性グループの同期の状態は正しい状態になる必要があります。つまり、ノード C のセカンダリレプリカは UNSYNCHRONIZED 状態として示される必要があります。ただし、ノード C でクォーラムが強制された場合、可用性グループの同期は正しくなくなります。クラスターの同期の状態は、ノード C が切断された時点まで戻ります。つまり、ノード C のセカンダリレプリカは誤って SYNCHRONIZED 状態として示されます。計画的な手動フェールオーバーはデータの安全性を保証するため、クォーラムの強制後に可用性グループをオンラインに戻すために使用することはできません。

データ損失の可能性の追跡

WSFC クラスターに正常なクォーラムがある場合、データベースのデータが損失する現在の可能性を推測することができます。特定のセカンダリレプリカの場合、データ損失の現在の可能性は、ローカルセカンダリデータベースが対応するプライマリデータベースにどの程度遅れているかによって決まります。遅延の程度は時間の経過と共に変化するため、非同期のセカンダリデータベースについてデータ損失の可能性を定期的に追跡することをお勧めします。遅延を追跡するには、次のように、各プライマリデータベースとそのセカンダリデータベースの最後にコミットした LSN および最終コミット時間を比較する必要があります。

プライマリレプリカに接続します。
sys.dm_hadr_database_replica_states 動的管理ビューの last_commit_lsn (最後にコミットされたトランザクションの LSN) 列および last_commit_time (最終コミット時間) 列に対してクエリを実行します。
各プライマリデータベースとその各セカンダリデータベースに返された値を比較します。最後にコミットした LSN の差異は、遅延の程度を示します。
1 つのデータベースまたは一連のデータベースでの遅延の程度が一定期間、指定した遅延の最大値を超えた場合に、警告を表示させることができます。たとえば、クエリは、各プライマリデータベースで 1 分ごとに実行されるジョブによって実行できます。プライマリデータベースとそのセカンダリデータベースの last_commit_time の差異が、最後にジョブが実行された後に目標復旧ポイント (RPO) (たとえば、5 分) を超えた場合、ジョブは警告を生成できます。

重要

WSFC クラスターにクォーラムが存在しない場合またはクォーラムが強制されている場合は、 last_commit_lsn と last_commit_time は NULL になります。クォーラム強制後のデータ損失を回避する方法の詳細については、「可用性グループの強制手動フェールオーバーの実行 (SQL Server)」を参照してください。

データ損失の可能性への対処

フェールオーバーの強制後は、すべてのセカンダリデータベースが中断されます。これには、元のプライマリデータベースも含まれます (元のプライマリレプリカは、オンラインに戻った後でセカンダリレプリカになります)。各セカンダリレプリカで、中断されたデータベースをそれぞれ手動で再開する必要があります。

前のプライマリレプリカが使用可能になると、そのデータベースは破損していないと想定されるので、データ損失の可能性に対処できます。データ損失の可能性に対処するために使用できる方法は、元のプライマリレプリカが新しいプライマリレプリカに接続されたかどうかによって異なります。元のプライマリレプリカが新しいプライマリインスタンスにアクセスできる場合、自動的かつ透過的に再接続されます。

元のプライマリレプリカが再接続された場合

通常、障害発生後は、元のプライマリレプリカは再起動するとすぐに、パートナーに再接続します。再接続時に、元のプライマリレプリカがセカンダリレプリカになります。そのデータベースはセカンダリデータベースになり、SUSPENDED 状態になります。新しいセカンダリデータベースは、データベースを再開しない限り、ロールバックされません。

ただし、中断されたデータベースにはアクセスできないため、データベースを調査しても、指定されたデータベースを再開したときに失われるデータを評価することはできません。そのため、セカンダリデータベースを再開するか削除するかは、次に示すようにデータの損失を許容できるかどうかによって決まります。

データの損失を許容できない場合は、データベースを可用性グループから削除して、データベースを復旧する必要があります。

データベース管理者は元のプライマリデータベースを復旧し、失われる可能性のあるデータの復旧を試みることができるようになります。ただし、元のプライマリデータベースがオンラインになったときに、そのデータベースは現在のプライマリデータベースとは一致しません。そのため、データベース間の不一致が拡大するのを防ぎ、クライアントのフェールオーバーの問題を回避するために、データベース管理者は削除されたデータベースまたは現在のプライマリデータベースにクライアントがアクセスできないようにする必要があります。
ビジネス目標を考慮してもデータの損失を許容できる場合は、セカンダリデータベースを再開できます。

新しいセカンダリデータベースを再開すると、データベース同期の最初のステップとしてこのデータベースがロールバックされます。障害発生時にログレコードが送信キューで待機していた場合、対応するトランザクションはコミットされていた場合でも失われます。

元のプライマリレプリカが再接続されなかった場合

元のプライマリレプリカが新しいプライマリレプリカにネットワーク経由で再接続するのを一時的に防ぐことができる場合、元のプライマリデータベースを調査して、データベースが再開されたらどのデータが失われるのかを評価できます。

データ損失が許容される場合

元のプライマリレプリカから新しいプライマリレプリカへの再接続を許可します。再接続によって新しいセカンダリデータベースが中断されます。データベースのデータの同期を開始するには、単にそれを再開します。新しいセカンダリレプリカがそのデータベースの元の復旧分岐を削除し、以前のセカンダリレプリカに送信されなかったか以前のセカンダリレプリカによって受信されなかったすべてのトランザクションが失われます。
データ損失が許容されない場合

中断されたデータベースを再開したら失われる重要なデータが元のプライマリデータベースに含まれている場合、そのデータベースを可用性グループから削除することにより元のプライマリデータベース上のデータを保持できます。これにより、データベースが RESTORING 状態になります。この時点で、削除されたデータベースのログの末尾をバックアップしておくことをお勧めします。その後、復旧するデータを元のプライマリデータベースからエクスポートして、そのデータを現在のプライマリデータベースにインポートすることにより、現在のプライマリデータベース (前のセカンダリデータベース) を更新できます。更新されたプライマリデータベースの完全バックアップを、できるだけ早く実行することをお勧めします。

その後で、RESTORE WITH NORECOVERY を使用してこのバックアップ (および 1 つ以上の後続ログバックアップ) を復元することにより、新しいセカンダリレプリカをホストするサーバーインスタンスで、中断されたセカンダリデータベースを削除して新しいセカンダリデータベースを作成することができます。対応するセカンダリデータベースを再開するまで、現在のプライマリデータベースの追加のログバックアップを遅らせることをお勧めします。

警告

プライマリデータベースでは、いずれかのセカンダリデータベースが中断している間は、トランザクションログの切り捨てが遅延されます。また、同期コミットセカンダリレプリカの同期状態は、いずれかのローカルデータベースが中断している間は、HEALTHY に移行できません。

Related Tasks

フェールオーバーの動作を設定するには

手動フェールオーバーを実行するには

WSFC クォーラムの構成を設定するには

参照

Always On 可用性グループの概要 (SQL Server)
可用性モード (AlwaysOn 可用性グループ)
Windows Server フェールオーバークラスタリング (WSFC) と SQL Server
Always On 可用性グループとデータベースミラーリングでの複数データベースにまたがるトランザクションと分散トランザクション (SQL Server)
Failover Policy for Failover Cluster Instances
可用性グループの自動フェールオーバーのための柔軟なフェールオーバーポリシー (SQL Server)

フェールオーバーとフェールオーバーモード (AlwaysOn 可用性グループ)

用語と定義

フェールオーバーの概要

フェールオーバーセット

自動フェールオーバー

自動フェールオーバーに必要な条件

自動フェールオーバーの動作

自動フェールオーバーを設定するには

計画的な手動フェールオーバー (データ損失なし)

手動フェールオーバーに必要な条件

計画的な手動フェールオーバーの動作

アップグレード中の可用性の維持

強制フェールオーバー (データ損失の可能性あり)

強制フェールオーバーの動作

強制フェールオーバーのリスク

クォーラムの強制後に強制フェールオーバーが必要な理由

データ損失の可能性の追跡

データ損失の可能性への対処

元のプライマリレプリカが再接続された場合

元のプライマリレプリカが再接続されなかった場合

Related Tasks

関連コンテンツ

参照

フィードバック

フィードバック

その他のリソース

フェールオーバーとフェールオーバー モード (AlwaysOn 可用性グループ)

用語と定義

フェールオーバーの概要

フェールオーバー セット

自動フェールオーバー

自動フェールオーバーに必要な条件

自動フェールオーバーの動作

自動フェールオーバーを設定するには

計画的な手動フェールオーバー (データ損失なし)

手動フェールオーバーに必要な条件

計画的な手動フェールオーバーの動作

アップグレード中の可用性の維持

強制フェールオーバー (データ損失の可能性あり)

強制フェールオーバーの動作

強制フェールオーバーのリスク

クォーラムの強制後に強制フェールオーバーが必要な理由

データ損失の可能性の追跡

データ損失の可能性への対処

元のプライマリ レプリカが再接続された場合

元のプライマリ レプリカが再接続されなかった場合

Related Tasks

関連コンテンツ

参照

フィードバック

フィードバック

その他のリソース

フェールオーバーとフェールオーバーモード (AlwaysOn 可用性グループ)

フェールオーバーセット

元のプライマリレプリカが再接続された場合

元のプライマリレプリカが再接続されなかった場合