可用性グループのレプリカのアップグレード

[アーティクル]
04/12/2023

適用対象:SQL Server

Always On 可用性グループ (AG) をホストする SQL Server インスタンスを新しい SQL Server バージョン、新しい SQL Server サービスパックまたは累積更新プログラムにアップグレードしている場合、または新しい Windows サービスパックまたは累積更新プログラムにインストールしている場合、ローリングアップグレードを実行して、単一の手動フェールオーバー (または、元のプライマリにフェールバックする場合は、2 回の手動フェールオーバー) におけるプライマリレプリカのダウンタイムを減らすことができます。

アップグレードプロセス中に、セカンダリレプリカはフェールオーバーや読み取り専用操作を行うことができなくなります。また、アップグレード後は、プライマリレプリカノード上のアクティビティ量に応じて、プライマリレプリカノードを検出するセカンダリレプリカの時間がかかる場合があります (そのため、高いネットワークトラフィック量が予想されます)。

また、新しいバージョンの SQL Server を実行しているセカンダリレプリカに最初にフェールオーバーした後は、その AG のデータベースは、最新バージョンに移動するためにアップグレードプロセス経由で実行されることに注意してください。この間、これらのいずれのデータベースにも読み取り可能なレプリカはありません。最初のフェールオーバー後のダウンタイムは、AG に含まれるデータベースの数によって異なります。元のプライマリへのフェールバックを計画する場合、フェールバックするときに、この手順が繰り返されることはありません。

Note

この記事では、SQL Server 自体のアップグレードについてのみ説明します。これには、Windows Server フェールオーバークラスター (WSFC) を含む、オペレーティングシステムのアップグレードは含まれません。フェールオーバークラスターをホストしている Windows オペレーティングシステムのアップグレードは、Windows Server 2012 R2 より前のオペレーティングシステムではサポートされません。 Windows Server 2012 R2 で実行されているクラスターノードのアップグレードについては、「Cluster Operating System Rolling Upgrade」(クラスターオペレーティングシステムのローリングアップグレード) を参照してください。

前提条件

作業を開始する前に、次の重要な情報を確認してください。

サポートされるバージョンとエディションのアップグレード: お使いのバージョンの Windows オペレーティングシステムと SQL Server から最新のバージョンの SQL Server にアップグレードできることを確認します。たとえば、SQL Server 2005 インスタンスから直接アップグレードした場合、データベース互換レベルがアップグレードされます。
データベースエンジンのアップグレード方法の選択: 正しい順序でアップグレードするには、サポートされるバージョンとエディションのアップグレードに基づいて、また、自分の環境にインストールされているその他のコンポーネントに基づいて、適切なアップグレードの方法と手順を選択します。
データベースエンジンのアップグレード計画の策定およびテスト:リリースノート、アップグレードに関する既知の問題、アップグレード前のチェックリストを確認して、アップグレードの計画を作成およびテストします。
SQL Server のインストールに必要なハードウェアおよびソフトウェア:SQL Server のインストールにおけるソフトウェア要件を確認します。その他のソフトウェアが必要な場合は、ダウンタイムを最小限に抑えるために、アップグレードプロセスを開始する前に、各ノードにソフトウェアをインストールします。
変更データキャプチャまたはレプリケーションを AG データベースに使用するかどうかの確認: AG のデータベースを変更データキャプチャ (CDC) に対して有効にする場合は、この手順を完了してください。

Note

同じ AG 内で SQL Server インスタンスのバージョンが混在することは、ローリングアップグレード以外ではサポートされていません。また、アップグレードはすぐに実行されるため、長期間その状態のままにしないでください。 SQL Server 2016 (13.x) 以降のバージョンをアップグレードするには、分散可用性グループを使用する方法もあります。

可用性グループのローリングアップグレードの基本

サーバーのアップグレードまたは更新を行う時に、AG のダウンタイムとデータ損失を最小限に抑えるには、次のガイドラインに従ってください。

ローリングアップグレードを始める前に:
- 少なくとも 1 つの同期コミットレプリカインスタンスで試験的に手動フェールオーバーを実行する。
- すべての可用性データベースを対象にデータベースの完全バックアップを実行し、データを保護する。
- すべての可用性データベースに対して DBCC CHECKDB コマンドを実行する
常に、最初はリモートのセカンダリレプリカノード、次にローカルのセカンダリレプリカインスタンス、最後にプライマリレプリカインスタンスという順序でアップグレードしてください。
アップグレード中のデータベースでバックアップを実行することはできません。セカンダリレプリカをアップグレードする前に、プライマリレプリカでのみバックアップを実行するように自動バックアップ設定を構成します。バージョンのアップグレード中に、レプリカをバックアップ用に読み取ったり、使用したりすることはできません。バージョン以外のアップグレード時には、プライマリレプリカをアップグレードする前に、セカンダリレプリカで実行するように自動化されたバックアップを構成できます。
バージョンアップグレード中、読み取り可能なセカンダリがアップグレードされてから、プライマリレプリカがアップグレード済みのセカンダリにフェールオーバーされるまで、またはプライマリレプリカがアップグレードされるまでの間、読み取り可能なセカンダリを読み取ることはできません。
アップグレードプロセスの間に AG が誤ってフェールオーバーされることを防ぐために、作業開始前にすべての同期コミットレプリカから可用性フェールオーバーを削除してください。
最初にセカンダリレプリカを使用してアップグレードされたインスタンスに AG をフェールオーバーする前に、プライマリレプリカインスタンスをアップグレードしないでください。このベストプラクティスに従わなかった場合、プライマリレプリカインスタンスでのアップグレード時にクライアントアプリケーションで長時間のダウンタイムが発生する可能性があります。
AG は常に同期コミットセカンダリレプリカインスタンスにフェールオーバーしてください。非同期コミットセカンダリレプリカインスタンスにフェールオーバーした場合、データベースでデータ損失が発生しやすく、データ移動が自動的に中断されます。データ移動を再開するには、手動で操作する必要があります。
他のセカンダリレプリカインスタンスをアップグレードまたは更新する前に、プライマリレプリカインスタンスをアップグレードしないでください。アップグレードされたプライマリレプリカから、同じバージョンにまだアップグレードされていない SQL Server インスタンスのあるセカンダリレプリカにログを送信できなくなります。セカンダリレプリカへのデータ移動が中断されているときには、そのレプリカに対する自動フェールオーバーは実行されず、可用性データベースでデータ損失が発生する危険性が高まります。これは、古いプライマリから新しいプライマリに手動でフェールオーバーするローリングアップグレード中にも適用されます。そのため、古いプライマリをアップグレードした後、同期の再開が必要になる場合があります。
AG をフェールオーバーする前に、フェールオーバーターゲットの同期状態が SYNCHRONIZED であることを確認してください。
警告

古いバージョンの SQL Server がインストールされているサーバーに新しいインスタンスまたは新しいバージョンの SQL Server をインストールすると、古いバージョンの SQL Server でホストされている可用性グループが誤って停止する可能性があります。これは、インスタンスまたは SQL Server のバージョンのインストール中に、SQL Server 高可用性モジュール (RHS.EXE) がアップグレードされるためです。これにより、サーバー上のプライマリロール内の既存の可用性グループが一時的に中断します。そのため、可用性グループが使用されている古いバージョンの SQL Server を既にホストしているシステムに、新しいバージョンの SQL Server をインストールするときは、次のいずれかのようにすることを強くお勧めします。
- メンテナンス期間中に、新しいバージョンの SQL Server をインストールします。
- 可用性グループをセカンダリレプリカにフェールオーバーして、新しい SQL Server インスタンスのインストールの間はプライマリではないようにします。

ローリングアップグレードプロセス

実際のプロセスは、AG の配置トポロジや各レプリカのコミットモードなどの要因によって変わります。ただし、最も単純なシナリオにおけるローリングアップグレードは、次の手順で構成される単純な複数段階のプロセスになります。

HADR シナリオでの AG のアップグレードの図。

すべての同期コミットレプリカの自動フェールオーバーを削除する。
すべての非同期コミットセカンダリレプリカインスタンスをアップグレードする。
すべてのリモート同期コミットセカンダリレプリカインスタンスをアップグレードする。
すべてのローカル同期コミットセカンダリレプリカインスタンスをアップグレードする。
AG を手動で (新規にアップグレードした) ローカルの同期コミットセカンダリレプリカにフェールオーバーする。
それまでプライマリレプリカをホストしていたローカルのレプリカインスタンスをアップグレードまたは更新する。
必要に応じて自動フェールオーバーパートナーを構成する。

必要であれば、さらに手動でフェールオーバーを実行して、AG を元の構成に戻すこともできます。

Note

同期コミットレプリカをアップグレードしてそれをオフラインにしても、プライマリのトランザクションは遅延しません。セカンダリレプリカを切断すると、セカンダリレプリカにログが書き込まれるのを待たずに、トランザクションはプライマリにコミットされます。

REQUIRED_SYNCHRONIZED_SECONDARIES_TO_COMMIT が 1 または 2 に設定されている場合、更新処理中に対応する数の同期セカンダリレプリカを使用できないときは、プライマリレプリカを読み書きできない場合があります。

注意

セカンダリレプリカを新しいバージョンのSQL Serverにインプレースアップグレードすると、可用性グループ内のデータベースは、可用性グループが手動でフェールオーバーされるまで、同期中/復旧中または同期済/復旧中状態のままになり、データベースの復旧とアップグレードが完了します。アップグレードされたプライマリレプリカは、下位バージョンのセカンダリレプリカにログを送信できなくなり、データ移動が停止し、そのレプリカに対して自動フェールオーバーが発生しなくなるため、可用性データベースはデータ損失に対して脆弱になります。古いプライマリをアップグレードした後、同期の再開が必要になる場合があります。新しいバージョンのレプリカにフェールオーバーする前に、すべてのセカンダリレプリカをアップグレードすることを推奨します。これにより、データベースを新しい形式にアップグレードした後にフェールオーバーを実行できます。

1 つのリモートセカンダリレプリカを含む AG

ディザスターリカバリーのみを目的として AG を配置していた場合、AG を非同期コミットセカンダリレプリカにフェールオーバーする必要がある場合があります。次の図に、そのような構成の例を示します。

DR シナリオでの AG のアップグレードの図。

この場合には、ローリングアップグレード時に AG を非同期コミットセカンダリレプリカにフェールオーバーする必要があります。データ損失を防ぐために、コミットモードを同期コミットに変更し、セカンダリレプリカが同期されるまで待ってから、AG をフェールオーバーします。そのため、ローリングアップグレードのプロセスは次のようになります。

リモートサイトのセカンダリレプリカインスタンスをアップグレードする。
コミットモードを同期コミットに変更する。
同期状態が SYNCHRONIZED になるまで待機する
AG をリモートサイトのセカンダリレプリカにフェールオーバーする
ローカル (プライマリサイト) のレプリカインスタンスをアップグレードまたは更新する。
AG をプライマリサイトにフェールオーバーして戻す
コミットモードを非同期コミットに変更する。

同期コミットモードはリモートサイトとのデータ同期には推奨されない設定であるため、設定の変更後、クライアントアプリケーションでデータベース待機時間が急増する可能性があります。さらに、フェールオーバーを実行すると未確認のログメッセージがすべて破棄されます。 2 つのサイト間のネットワーク待機時間が長いと、破棄されるログメッセージの数が膨大になり、クライアントで大量のトランザクションエラーが発生することがあります。クライアントアプリケーションへの影響を最小限に抑えるには、次のようにします。

クライアントトラフィックが少ない時間帯にメンテナンス予定を設定する。
プライマリサイトの SQL Server をアップグレードまたは更新するときに、可用性モードを非同期コミットに戻し、もう一度プライマリサイトへのフェールオーバーの準備が完了したときに、同期コミットに戻す。

フェールオーバークラスターインスタンスノードを含む AG

AG にフェールオーバークラスターインスタンス (FCI) ノードが含まれている場合、非アクティブなノードをアップグレードした後で、アクティブなノードをアップグレードする必要があります。次の図では、ローカルでの可用性を高めるために FCI を使用し、リモートのディザスターリカバリーのために FCI 間の非同期コミットを使用する、一般的な AG のシナリオを示します。さらに、アップグレード手順も示しています。

FCI での AG のアップグレードの図。

REMOTE2 をアップグレードまたは更新する
FCI2 を REMOTE2 にフェールオーバーする
REMOTE1 をアップグレードまたは更新する
PRIMARY2 をアップグレードまたは更新する
FCI1 を PRIMARY2 にフェールオーバーする
PRIMARY1 をアップグレードまたは更新する

複数の AG を含む SQL Server インスタンスをアップグレードまたは更新する

プライマリレプリカが別々のサーバーノード (アクティブ/アクティブ構成) に存在する AG が複数実行されている場合、アップグレード時にはプロセスの高可用性を維持するためのフェールオーバー手順を追加で実行する必要があります。次の表に示すように、3 つのサーバーノードで 3 つの AG が実行され、すべてのレプリカが同期コミットモードで実行されているとします。

AG	Node1	Node2	Node3
AG1	プライマリ
AG2		プライマリ
AG3			プライマリ

この状況では、次の順序で負荷分散ローリングアップグレードを実行することが適切であると考えられます。

AG2 を Node3 にフェールオーバーする (Node2 を解放するため)
Node2 をアップグレードまたは更新する
AG1 を Node2 にフェールオーバーする (Node1 を解放するため)
Node1 をアップグレードまたは更新する
AG2 と AG3 を Node1 にフェールオーバーする (Node3 を解放するため)
Node3 をアップグレードまたは更新する
AG3 を Node3 にフェールオーバーする

この順序でアップグレードを実行した場合、1 つの AG に対して 2 回のフェールオーバーを実行するよりも平均ダウンタイムが短くなります。実行後の構成は、次の表のようになります。

AG	Node1	Node2	Node3
AG1		プライマリ
AG2	プライマリ
AG3			プライマリ

実際の実装方法に応じて、アップグレードの手順が変わる可能性があります。また、クライアントアプリケーションで発生するダウンタイムも変わります。

Note

多くの場合は、ローリングアップグレードが完了すると、元のプライマリレプリカにフェールバックします。

分散型可用性グループのローリングアップグレード

分散型可用性グループのローリングアップグレードを実行するには、まずすべてのセカンダリレプリカをアップグレードします。次に、フォワーダーがフェールオーバーされ、セカンダリ可用性グループの最後の残りのインスタンスがアップグレードされます。その他すべてのレプリカがアップグレードされると、グローバルプライマリがフェールオーバーされ、最初の可用性グループの最後の残りのインスタンスがアップグレードされます。手順を含む詳細な図を次に示します。

Note

多くの場合は、ローリングアップグレードが完了すると、元のプライマリレプリカにフェールバックされます。

分散型可用性グループをアップグレードする一般的な手順

すべてのデータベース (システムデータベースなど) および可用性グループに参加しているデータベースをバックアップします。
セカンダリ可用性グループ (ダウンストリーム) のセカンダリレプリカがすべてアップグレードおよび再起動されます。
最初の可用性グループ (アップストリーム) のセカンダリレプリカがすべてアップグレードおよび再起動されます。
フォワーダープライマリがセカンダリ可用性グループのアップグレードされたセカンダリレプリカにフェールオーバーされます。
データ同期を待ちます。データベースはすべての同期コミットレプリカ上で同期されたと示され、グローバルプライマリはフォワーダーと同期されます。
セカンダリ可用性グループの最後の残りのインスタンスがアップグレードして再起動されます。
グローバルプライマリが最初の可用性グループのアップグレードされたセカンダリにフェールオーバーされます。
プライマリ可用性グループの最後の残りのインスタンスがアップグレードされます。
新しくアップグレードされたサーバーが再起動されます。
(省略可能) 両方の可用性グループが元のプライマリレプリカにフェールバックされます。

重要

すべてのステップ間の同期を確認します。次のステップに進む前に、同期コミットレプリカが可用性グループ内で同期され、グローバルプライマリが分散型 AG 内のフォワーダーと同期されていることを確認します。

推奨事項:同期を確認するたびに、データベースノードと SQL Server Management Studio 内の分散型 AG ノードの両方を更新してください。すべてが同期された後に、各レプリカの状態のスクリーンショットを保存します。これは、現在のステップを追跡したり、次のステップに進む前にすべてが正常に作業されたという証拠を提供したり、問題が発生した場合にトラブルシューティングでサポートを行ったりするのに役立ちます。

分散型可用性グループのローリングアップグレードの例の図

可用性グループ	プライマリレプリカ	セカンダリレプリカ
AG1	`NODE1\SQLAG`	`NODE2\SQLAG`
AG2	`NODE3\SQLAG`	`NODE4\SQLAG`
DistributedAG	AG1 (グローバル)	AG2 (フォワーダー)

分散型 AG の図。

この図のインスタンスをアップグレードするステップ

すべてのデータベース (システムデータベースなど) および可用性グループに参加しているデータベースをバックアップします。
NODE4\SQLAG (AG2 のセカンダリ) をアップグレードして、サーバーを再起動します。
NODE2\SQLAG (AG1 のセカンダリ) をアップグレードして、サーバーを再起動します。
AG2 を NODE3\SQLAG から NODE4\SQLAG にフェールオーバーします。
NODE3\SQLAG をアップグレードして、サーバーを再起動します。
AG1 を NODE1\SQLAG から NODE2\SQLAG にフェールオーバーします。
NODE1\SQLAG をアップグレードして、サーバーを再起動します。
(省略可能) 元のプライマリレプリカにフェールバックされます。
1. AG2 を NODE4\SQLAG から NODE3\SQLAG にフェールバックします。
2. AG1 を NODE2\SQLAG から NODE1\SQLAG にフェールバックします。

各可用性グループに 3 番目のレプリカが存在する場合は、NODE3\SQLAG と NODE1\SQLAG の前にアップグレードします。

重要

推奨事項: 同期を確認するたびに、データベースノードと SQL Server Management Studio 内の分散型 AG ノードの両方を更新してください。すべてが同期された後は、スクリーンショットを取得して保存します。これは、現在のステップを追跡したり、次のステップに進む前にすべてが正常に作業されたという証拠を提供したり、問題が発生した場合にトラブルシューティングでサポートを行ったりするのに役立ちます。

変更データキャプチャまたはレプリケーションの特別な手順

更新が適用されているかによって、変更データキャプチャまたはレプリケーションを有効にしている AG レプリカデータベースに対して追加の手順が必要な場合があります。次の手順が必要かどうかを確認するには、更新プログラムのリリースノートを参照してください。

各セカンダリレプリカをアップグレードします。
すべてのセカンダリレプリカがアップグレードされてから、AG をアップグレードされたインスタンスにフェールオーバーします。
プライマリレプリカをホストするインスタンスで、次の Transact-SQL を実行します。
```
EXECUTE [master].[sys].[sp_vupgrade_replication];
```
Note

このコマンドの実行には数分かかることがあります。 SQL Server 2019 CU1 以降の場合は、この手順をスキップしてください。詳細については、KB4530283 を参照してください。
元はプライマリレプリカであったインスタンスをアップグレードします。

背景情報については、最新の CU へのアップグレード後に CDC の機能が動作しない場合に関するページを参照してください。

可用性グループのレプリカのアップグレード

前提条件

可用性グループのローリングアップグレードの基本

ローリングアップグレードプロセス

1 つのリモートセカンダリレプリカを含む AG

フェールオーバークラスターインスタンスノードを含む AG

複数の AG を含む SQL Server インスタンスをアップグレードまたは更新する

分散型可用性グループのローリングアップグレード

分散型可用性グループをアップグレードする一般的な手順

分散型可用性グループのローリングアップグレードの例の図

変更データキャプチャまたはレプリケーションの特別な手順

関連項目

フィードバック

フィードバック

その他のリソース

可用性グループのレプリカのアップグレード

前提条件

可用性グループのローリング アップグレードの基本

ローリング アップグレード プロセス

1 つのリモート セカンダリ レプリカを含む AG

フェールオーバー クラスター インスタンス ノードを含む AG

複数の AG を含む SQL Server インスタンスをアップグレードまたは更新する

分散型可用性グループのローリング アップグレード

分散型可用性グループをアップグレードする一般的な手順

分散型可用性グループのローリング アップグレードの例の図

変更データ キャプチャまたはレプリケーションの特別な手順

関連項目

フィードバック

フィードバック

その他のリソース

可用性グループのローリングアップグレードの基本

ローリングアップグレードプロセス

1 つのリモートセカンダリレプリカを含む AG

フェールオーバークラスターインスタンスノードを含む AG

分散型可用性グループのローリングアップグレード

分散型可用性グループのローリングアップグレードの例の図

変更データキャプチャまたはレプリケーションの特別な手順