フェールオーバーグループの概要とベストプラクティス (Azure SQL Managed Instance)

[アーティクル]
01/05/2024

フェールオーバーグループ機能を使用すると、マネージドインスタンス内のすべてのユーザーデータベースの別の Azure リージョンへのレプリケーションやフェールオーバーを管理できます。この記事では、フェールオーバーグループ機能の概要と、Azure SQL Managed Instance で使用するためのベストプラクティスと推奨事項について説明します。

この機能の使用を開始するには、「Azure SQL Managed Instance のフェールオーバーグループの構成」を参照してください。

概要

フェールオーバーグループ機能を使うと、マネージドインスタンスから別の Azure リージョンのマネージドインスタンスへのユーザーデータベースのレプリケーションとフェールオーバーを管理できます。フェールオーバーグループは、geo レプリケーションデータベースの大規模なデプロイと管理を簡略化するように設計されています。

詳しくは、Azure SQL Managed Instance の高可用性に関する記事をご覧ください。 geo フェールオーバー RPO と RTO については、「ビジネス継続性の概要」を参照してください。

エンドポイントリダイレクト

フェールオーバーグループには、geo フェールオーバー中にそのまま残る読み取り/書き込みおよび読み取り専用リスナーエンドポイントが用意されています。接続は現在のプライマリに自動的にルーティングされるので、geo フェールオーバー後にアプリケーションの接続文字列を変更する必要はありません。 geo フェールオーバーでは、グループ内のすべてのセカンダリデータベースがプライマリロールに切り替まれます。 geo フェールオーバーが完了すると、DNS レコードが自動的に更新され、エンドポイントが新しいリージョンにリダイレクトされます。

読み取り専用ワークロードをオフロードする

プライマリデータベースへのトラフィックを減らすために、フェールオーバーグループ内のセカンダリデータベースを使用して、読み取り専用ワークロードをオフロードすることもできます。読み取り専用リスナーを使用して、読み取り専用のトラフィックを読み取り可能なセカンダリデータベースに送信します。

アプリケーションの回復

完全なビジネス継続性を実現するには、リージョンデータベースの冗長性を追加する方法は、ソリューションの一部に限定されます。致命的な障害の後にアプリケーション (サービス) をエンドツーエンドで復旧するには、そのサービスと依存しているサービスを構成するすべてのコンポーネントを復旧する必要があります。このようなコンポーネントの例には、クライアントソフトウェア (カスタム JavaScript が設定されたブラウザーなど)、Web フロントエンド、ストレージ、DNS などがあります。すべてのコンポーネントが同じ障害に耐性を持ち、アプリの復元時間目標（RTO）内で利用可能になることが重要です。そのため、依存するサービスをすべて特定し、これらのサービスが提供する保証と機能について把握しておく必要があります。そのうえで、依存するサービスのフェールオーバー中もサービスが確実に機能するように対策を講じる必要があります。

フェールオーバーポリシー

フェールオーバーグループでは、次の 2 つのフェールオーバーポリシーがサポートされています。

カスタマーマネージド (推奨) - お客様は、フェールオーバーグループ内の 1 つ以上のデータベースに影響を与える予期しない停止に気付いたときに、グループのフェールオーバーを実行できます。 PowerShell、Azure CLI、Rest API などのコマンドラインツールを使用する場合、カスタマーマネージドのフェールオーバーポリシー値は manual.
マイクロソフトマネージド - プライマリリージョンに影響を与える広範囲にわたる停止が発生した場合、マイクロソフトは、マイクロソフトが管理するように構成されたフェールオーバーポリシーを持つ影響を受けるすべてのフェールオーバーグループのフェールオーバーを開始します。マイクロソフトマネージドフェールオーバーは、個々のフェールオーバーグループまたはリージョン内のフェールオーバーグループのサブセットに対して開始されません。 PowerShell、Azure CLI、Rest API などのコマンドラインツールを使用する場合、マイクロソフトが管理するフェールオーバーポリシーの値は automatic.

次の表に示すように、各フェールオーバーポリシーには、一意のユースケースセットと、フェールオーバースコープとデータ損失に対する対応する想定があります。

フェールオーバーポリシー	フェールオーバースコープ	ユースケース	データ損失の可能性
お客様による管理 (おすすめ)	フェールオーバーグループ	フェールオーバーグループ内の 1 つ以上のデータベースが停止の影響を受け、使用できなくなります。フェールオーバーを選択できます。	はい
Microsoft マネージド	リージョン内のすべてのフェールオーバーグループ	データセンター、可用性ゾーン、またはリージョンで広範囲にわたる障害が発生すると、データベースが使用できなくなり、Microsoft Azure SQL サービスチームは強制フェールオーバーをトリガーすることを決定します。このオプションは、ディザスターリカバリーの責任をマイクロソフトに委任する必要があり、アプリケーションが少なくとも 1 時間以上の RTO (ダウンタイム) に耐えられる場合にのみ使用します。	はい

お客様による管理

まれに、組み込みの可用性または高可用性だけでは停止を軽減できません。また、フェールオーバーグループ内のデータベースは、データベースを使用するアプリケーションのサービスレベルアグリーメント (SLA) に許容できない期間は使用できなくなる可能性があります。データベースは、少数のデータベースのみに影響するローカライズされた問題が原因で使用できない場合があります。または、データセンター、可用性ゾーン、またはリージョンレベルにある可能性があります。いずれの場合も、ビジネス継続性を復元するために、強制フェールオーバーを開始できます。

フェールオーバーポリシーをカスタマーマネージドに設定することを強くお勧めします。フェールオーバーを開始してビジネス継続性を復元するタイミングを制御できます。フェールオーバーグループ内の 1 つ以上のデータベースに影響を与える予期しない停止が発生した場合に、フェールオーバーを開始できます。

Microsoft マネージド

マイクロソフトマネージドフェールオーバーポリシーでは、ディザスターリカバリーの責任が Azure SQL サービスに委任されます。 Azure SQL サービスで強制フェールオーバーを開始するには、次の条件を満たす必要があります。

自然災害イベント、構成の変更、ソフトウェアのバグまたはハードウェアコンポーネントの障害、およびリージョン内の多くのデータベースによって発生するデータセンター、可用性ゾーン、またはリージョンレベルの停止が影響を受けます。
猶予期間が切れています。停電の規模を確認し、緩和するかどうかは人間の行動に依存するため、猶予期間を 1 時間以下に設定することはできません。

これらの条件が満たされると、Azure SQL サービスは、フェールオーバーポリシーがマイクロソフトマネージドに設定されているリージョン内のすべてのフェールオーバーグループに対して強制フェールオーバーを開始します。

フェールオーバーポリシーは、次の場合にのみマイクロソフトマネージドに設定します。

ディザスターリカバリーの責任を Azure SQL サービスに委任する必要があります。
アプリケーションは、データベースが少なくとも 1 時間以上使用できないことに耐えられます。
強制フェールオーバーの実際の時間は大きく異なる可能性があるため、猶予期間の有効期限が切れた後に強制フェールオーバーをトリガーすることは許容されます。
ゾーンの冗長性の構成や可用性の状態に関係なく、フェールオーバーグループ内のすべてのデータベースがフェールオーバーしてもかまいません。ゾーン冗長用に構成されたデータベースはゾーン障害に対する回復性があり、障害の影響を受ける可能性はありませんが、マイクロソフトマネージドフェールオーバーポリシーを使用するフェールオーバーグループの一部である場合でもフェールオーバーされます。
アプリケーションが使用する他の Azure サービスまたはコンポーネントに対するアプリケーションの依存関係を考慮せずに、フェールオーバーグループ内のデータベースを強制的にフェールオーバーすることは許容されます。これにより、アプリケーションのパフォーマンスの低下や使用不能が発生する可能性があります。
強制フェールオーバーの正確な時刻を制御できず、セカンダリデータベースの同期状態を無視するため、不明な量のデータ損失が発生してもかまいません。
フェールオーバーグループ内のすべてのプライマリデータベースとセカンダリデータベースは、同じサービス層、コンピューティング層 (プロビジョニングまたはサーバーレス)、およびコンピューティングサイズ (DTU または仮想コア) で作成されます。フェールオーバーグループ内のすべてのデータベースのサービスレベル目標 (SLO) が一致しない場合、フェールオーバーポリシーは最終的に Microsoft マネージドから Azure SQL サービスによるカスタマーマネージドに更新されます。

マイクロソフトによってフェールオーバーがトリガーされると、操作名 Failover Azure SQL フェールオーバーグループのエントリが Azure Monitor アクティビティログに追加されます。エントリには[リソース] の下のフェールオーバーグループの名前が含まれ、イベントによって開始されたイベントには、フェールオーバーがマイクロソフトによって開始されたことを示す 1 つのハイフン (-) が表示されます。この情報は、Azure portal の新しいプライマリサーバーまたはインスタンスの [アクティビティログ] ページでも確認できます。

用語と機能

フェールオーバーグループ (FOG)

フェールオーバーグループを使用すると、プライマリリージョンの停止によってプライマリマネージドインスタンスが使用できなくなった場合に備え、マネージドインスタンス内のすべてのユーザーデータベースを 1 つのユニットとして別の Azure リージョンにフェールオーバーできます。 SQL Managed Instance のフェールオーバーグループには、そのインスタンス内のすべてのユーザーデータベースが含まれています。そのため、1 つインスタンスにつき構成できるフェールオーバーグループは 1 つのみとなります。

重要

フェールオーバーグループの名前は、.database.windows.net ドメイン内でグローバルに一意である必要があります。
プライマリ

フェールオーバーグループのプライマリデータベースをホストするマネージドインスタンス。
セカンダリ

フェールオーバーグループのプライマリデータベースをホストするセカンダリインスタンス。セカンダリをプライマリと同じ Azure リージョンに配置することはできません。
重要
- データベースにインメモリ OLTP オブジェクトが含まれている場合、インメモリ OLTP オブジェクトがメモリ内に存在するため、プライマリインスタンスとターゲットセカンダリ geo レプリカデータベースには一致するサービスレベルが必要です。 geo レプリカインスタンスのサービスレベルが低いと、メモリ不足の問題が発生する可能性があります。この問題が発生すると、セカンダリレプリカがデータベースの復旧に失敗し、セカンダリデータベースと geo セカンダリ上のインメモリ OLTP オブジェクトが使用できなくなる可能性があります。これにより、フェールオーバーも失敗する可能性があります。これを回避するには、geo セカンダリインスタンスのサービスレベルがプライマリデータベースのサービスレベルと一致していることを確認します。サービスレベルのアップグレードは、データサイズの操作になる場合があり、完了するまでに時間がかかる場合があります。

フェールオーバー (データ損失なし)

フェールオーバーでは、セカンダリがプライマリロールに切り替わる前に、プライマリデータベースとセカンダリデータベース間の完全なデータ同期が行われます。これにより、データ損失が発生しないことが保証されます。フェールオーバーは、プライマリにアクセスできる場合にのみ可能です。フェールオーバーは、次のシナリオで使用されます。
- データ損失が許容されない場合は、運用環境でディザスターリカバリー (DR) ドリルを行います
- ワークロードを別のリージョンに再配置します
- 機能停止が軽減 (フェールバック) された後、ワークロードをプライマリリージョンに返します
強制フェールオーバー (データ損失の可能性)

強制フェールオーバーの場合、最近の変更がプライマリから反映されるのを待たずに、直ちにセカンダリがプライマリに切り替わります。この操作を実行するとデータが失われる可能性があります。強制フェールオーバーは、機能停止時においてプライマリにアクセスできない場合に回復手段として使用されます。停止が緩和されると、以前のプライマリは自動的に再接続され、新しいセカンダリになります。フェールオーバーを実行してフェールバックし、レプリカを元のプライマリとセカンダリのロールに戻すこともできます。
データ消失の猶予期間

非同期レプリケーションを使用してデータがセカンダリにレプリケートされるため、マイクロソフトマネージドフェールオーバーポリシーを使用してグループを強制フェールオーバーすると、データが失われる可能性があります。アプリケーションのデータ損失の許容範囲が反映されるように、フェールオーバーポリシーをカスタマイズできます。 GracePeriodWithDataLossHours を構成することで、データ損失につながる可能性がある強制フェールオーバーの開始までに Azure SQLサービスが待機する時間を制御できます。

DNS ゾーン

新しい SQL Managed Instance の作成時に自動的に生成される一意の ID。このインスタンスのマルチドメイン (SAN) は、同じ DNS ゾーンのインスタンスに対するクライアント接続を認証する目的でプロビジョニングされます。同じフェールオーバーグループに属する 2 つのマネージドインスタンスでは、DNS ゾーンが共有される必要があります。
フェールオーバーグループの読み取り/書き込みリスナー

現在のプライマリをポイントする DNS CNAME レコード。フェールオーバーグループが作成されるときに自動的に作成され、フェールオーバー後にプライマリが変更された場合に、読み取り/書き込みワークロードがプライマリに透過的に再接続できるようにします。 SQL Managed Instance でフェールオーバーグループが作成されたときに、リスナー URL の DNS CNAME レコードの形式は <fog-name>.<zone_id>.database.windows.net になります。
フェールオーバーグループの読み取り専用リスナー

現在のセカンダリをポイントする DNS CNAME レコード。フェールオーバーグループが作成されるときに自動的に作成され、フェールオーバー後にセカンダリが変更された場合に、読み取り専用 SQL ワークロードがセカンダリに透過的に接続できるようにします。 SQL Managed Instance でフェールオーバーグループが作成されたときに、リスナー URL の DNS CNAME レコードの形式は <fog-name>.secondary.<zone_id>.database.windows.net になります。既定では、読み取り専用リスナーのフェールオーバーは無効になります。これにより、セカンダリがオフラインのときにプライマリのパフォーマンスに影響が及ばないようにします。ただし、セカンダリが回復するまで、読み取り専用セッションは接続できません。読み取り専用セッションのダウンタイムを許容できず、プライマリのパフォーマンスが下がる可能性があっても、読み取り専用と読み取り/書き込みの両方のトラフィックにプライマリを使用してもよければ、AllowReadOnlyFailoverToPrimary プロパティを構成することによって、読み取り専用リスナーのフェールオーバーを有効にできます。その場合、セカンダリが利用できないと、読み取り専用トラフィックがプライマリに自動的にリダイレクトされます。

Note

AllowReadOnlyFailoverToPrimary プロパティは、マイクロソフトマネージドフェールオーバーポリシーが有効になっていて、強制フェールオーバーがトリガーされる場合にのみ有効です。この場合、プロパティが True に設定されていると、新しいプライマリは読み取り/書き込みセッションと読み取り専用セッションの両方を提供します。

フェールオーバーグループのアーキテクチャ

フェールオーバーグループはプライマリインスタンスに構成する必要があり、それを別の Azure リージョンのセカンダリインスタンスに接続します。インスタンス内のすべてのユーザーデータベースは、セカンダリインスタンスにレプリケートされます。 master や msdb などのシステムデータベースはレプリケートされません。

次の図に、マネージドインスタンスとフェールオーバーグループを使用する、geo 冗長クラウドアプリケーションの一般的な構成を示します

Azure SQL Managed Instance のフェールオーバーグループのダイアグラム

アプリケーションでデータ層として SQL Managed Instance を使用する場合は、ビジネス継続性を考慮して設計する際にこれらの一般的なガイドラインとベストプラクティスに従ってください。

geo セカンダリインスタンスを作成する

フェールオーバー後にプライマリサーバーへの中断 SQL Managed Instance 接続を確保するには、プライマリインスタンスとセカンダリインスタンスの両方が同じ DNS ゾーンにある必要があります。同じマルチドメイン (SAN) 証明書を使用して、フェールオーバーグループ内の 2 つのインスタンスのいずれかへのクライアント接続を認証できます。アプリケーションを運用環境にデプロイする準備ができたら、別のリージョンでセカンダリ SQL Managed Instance を作成し、プライマリ SQL Managed Instance と DNS ゾーンを共有していることを確認します。これは、作成時に省略可能なパラメーターを指定することで実行できます。 PowerShell または REST API を使用している場合、省略可能なパラメーターの名前は DNSZonePartner です。テーブル内の対応する省略可能なフィールドのAzure portalは 、Primary Managed Instance です。

重要

サブネットに作成された最初のマネージドインスタンスにより、同じサブネット内のそれ以降のすべてのインスタンスに対する DNS ゾーンが決まります。つまり、同じサブネットの 2 つのインスタンスが異なる DNS ゾーンに属することはできません。

プライマリインスタンスと同じ DNS ゾーンでのセカンダリ SQL Managed Instance の作成の詳細については、「Azure SQL Managed Instance のフェールオーバーグループを構成する」を参照してください。

ペアリージョンを使用する

パフォーマンス上の理由により、両方のマネージドインスタンスを、ペアになっているリージョンにデプロイします。 SQLManaged Instanceリージョン内のフェールオーバーグループのパフォーマンスは、ペア設定されていないリージョンと比較して優れたものになります。

Azure SQL Managed Instance は、一般に Azure ペアリージョンが同時にデプロイされない安全なデプロイプラクティスに従います。ただし、最初にアップグレードされるリージョンを予測することはできないため、デプロイの順序は保証されません。プライマリインスタンスが最初にアップグレードされ、セカンダリインスタンスが最初にアップグレードされる場合があります。

Azure SQL Managed Instance がフェールオーバーグループの一部であり、グループ内のインスタンスが Azure のペアになっているリージョン内にない場合は、プライマリデータベースとセカンダリデータベースに対して異なるメンテナンス期間スケジュールを選択します。たとえば、geo セカンダリデータベースのメンテナンス期間には [平日] を選択し、geo プライマリデータベースのメンテナンス期間には [週末] を選択します。

インスタンス間の geo レプリケーショントラフィックフローを有効にして最適化する

プライマリとセカンダリのインスタンスをホストする仮想ネットワークサブネット間の接続は、geo レプリケーショントラフィックフローが中断しないように確立し、維持する必要があります。ネットワークトポロジとポリシーに基づいて選択できるインスタンス間の接続を提供するには、複数の方法があります。

その場合、グローバル仮想ネットワークピアリング (VNet ピアリング) が、フェールオーバーグループ内の 2 つのインスタンス間の接続を確立する方法として推奨されます。これにより、Microsoft バックボーンインフラストラクチャを使用して、ピアリングされた仮想ネットワーク間に低遅延で高帯域幅のプライベート接続が提供されます。ピアリングされた仮想ネットワーク間の通信では、パブリックインターネット、ゲートウェイ、追加の暗号化が必要ありません。

初期シード処理

マネージドインスタンス間でフェールオーバーグループを確立する場合、データレプリケーションが開始される前に、初期シード処理フェーズがあります。初期シード処理フェーズは、最も時間がかかり、最も負荷の高い操作です。初期シード処理が完了すると、データは同期され、その後はそれ以降のデータ変更のみがレプリケートされます。初期シード処理が完了するまでにかかる時間は、データのサイズ、レプリケートされるデータベースの数、プライマリデータベースのワークロードの強度、プライマリとセカンダリのインスタンスをホストする仮想ネットワーク間のリンク速度 (主に接続の確立方法に依存します) によって異なります。通常の状況では、推奨されるグローバル仮想ネットワークピアリングを使用して接続が確立されると、SQL Managed Instance のシード処理速度は 1 時間に最大 360 GB になります。シード処理は、ユーザーデータベースのバッチに対して並列で実行されます。すべてのデータベースで同時に実行されるわけではありません。インスタンスで多数のデータベースがホストされている場合は、複数のバッチが必要になる場合があります。

2 つのインスタンス間のリンクの速度が必要な速度よりも遅い場合は、シードする時間が大きな影響を受けそうになります。提示したシード処理速度、データベースの数、データの合計サイズ、およびリンク速度を使用して、データレプリケーションが開始される前に初期シード処理フェーズにかかる時間を見積もることができます。たとえば、100 GB のデータベースが 1 つの場合、リンクで 1 時間あたり 84 GB をプッシュでき、他のデータベースにシードしていないのであれば、初期シード処理フェーズにかかる時間は約 1.2 時間になります。リンクが転送できるのが 1 時間あたり 10 GB のみの場合、100 GB のデータベースのシード処理には約 10 時間かかります。レプリケートするデータベースが複数ある場合、シード処理は並列で実行されます。そして、低速リンク速度と組み合わせると、すべてのデータベースからのデータの並列シード処理が使用可能なリンク帯域幅を超えている場合は、初期シード処理の時間が大幅に長くなることがあります。

重要

非常に低速またはビジーなリンクの場合、初期シード処理フェーズでフェールオーバーグループの作成に数日かかり、タイムアウトになる可能性があります。作成プロセスは、6 日後に自動的に取り消されます。

geo セカンダリインスタンスへの geo フェールオーバーを管理する

フェールオーバーグループは、プライマリマネージドインスタンス上のすべてのデータベースの geo フェールオーバーを管理します。グループが作成されると、インスタンス内の各データベースが geo セカンダリインスタンスに自動的に geo レプリケートされます。フェールオーバーグループを使用して、データベースのサブセットの部分的なフェールオーバーを開始することはできません。

重要

プライマリマネージドインスタンスでデータベースが削除された場合は、geo セカンダリマネージドインスタンスでも自動的に削除されます。

読み取り/書き込みリスナーを使用する (プライマリ MI)

読み取り/書き込みワークロードの場合は、サーバー名として <fog-name>.zone_id.database.windows.net を使用します。接続は自動的にプライマリに向けられる。この名前はフェールオーバー後に変更されません。 geo フェールオーバーには DNS レコードの更新が含まれるので、新しいクライアント接続は、クライアント DNS キャッシュが更新された後にのみ新しいプライマリにルーティングされます。セカンダリインスタンスは DNS ゾーンをプライマリと共有するために、クライアントアプリケーションは同じサーバー側 SAN 証明書を使用してそのゾーンに再接続できます。既存のクライアント接続を終了してから再作成して、新しいプライマリにルーティングする必要があります。読み取り/書き込みリスナーと読み取り専用リスナーには、マネージドインスタンスのパブリックエンドポイントを介して到達することはできません。

読み取りリスナーを使用する (セカンダリ MI)

データ待機時間に耐える読み取り専用ワークロードを論理的に分離している場合は、geo セカンダリで実行できます。 geo セカンダリに直接接続するには、サーバー名として <fog-name>.secondary.<zone_id>.database.windows.net を使用します。

Business Critical レベルの SQL Managed Instance では、接続文字列の ApplicationIntent=ReadOnly パラメーターを使用して、読み取り専用レプリカを使用した読み取り専用クエリワークロードのオフロードがサポートされています。 Geo レプリケートされたセカンダリを構成した場合は、この機能を使用して、プライマリロケーション、または geo レプリケートされた場所の読み取り専用レプリカに接続できます。

プライマリロケーションの読み取り専用レプリカに接続するには、ApplicationIntent=ReadOnly と <fog-name>.<zone_id>.database.windows.net を使用します。
セカンダリロケーションの読み取り専用レプリカに接続するには、ApplicationIntent=ReadOnly と <fog-name>.secondary.<zone_id>.database.windows.net を使用します。

読み取り/書き込みリスナーと読み取り専用リスナーには、マネージドインスタンスのパブリックエンドポイントを介して到達することはできません。

フェールオーバー後のパフォーマンス低下の可能性

一般的な Azure アプリケーションでは、複数の Azure サービスを使用し、複数のコンポーネントで構成されます。グループの geo フェールオーバーは、Azure SQL コンポーネントだけの状態に基づいてトリガーされます。プライマリリージョンのその他の Azure サービスは機能停止の影響を受けない場合があり、それらのコンポーネントを引き続きそのリージョンで利用できる可能性があります。プライマリデータベースがセカンダリリージョンに切り替えられると、依存コンポーネント間の待機時間が長くなる場合があります。アプリケーションのパフォーマンスがリージョンをまたいで待機時間が長くなる影響を受けないように、セカンダリリージョンのすべてのアプリケーションコンポーネントに冗長性を確保し、アプリケーションコンポーネントをデータベースと共にフェールオーバーします。

強制フェールオーバー後のデータ損失の可能性

プライマリリージョンで障害が発生した場合、最近のトランザクションが geo セカンダリにレプリケートされていない可能性があり、強制フェールオーバーが実行されるとデータが失われる可能性があります。

DNS の更新

読み取り/書き込みリスナーの DNS の更新は、フェールオーバーが開始された後すぐに行われます。この操作によるデータの損失はありません。しかし、データベースロールの切り替えプロセスには、通常の状況で最大 5 分かかる場合があります。これが完了するまで、新しいプライマリインスタンスの一部のデータベースは引き続き読み取り専用となります。 PowerShell を使用してフェールオーバーが開始された場合、プライマリレプリカロールを切り替える操作は同時に発生します。 Azure portal を使用して開始された場合、UI で完了状態が示されます。 REST API を使用して開始された場合は、標準的な Azure Resource Manager のポーリングメカニズムを使用して、完了を監視します。

重要

geo フェールオーバーの原因となる停止が軽減された後は、手動計画フェールオーバーを使用してプライマリを元の場所に戻します。

ライセンスフリーの DR レプリカでコストを節約する

セカンダリマネージドインスタンスをディザスターリカバリー (DR) 専用に構成することで、SQL Server のライセンスコストを節約できます。これをセットアップするには、「Azure SQL Managed Instance のライセンスフリースタンバイレプリカを構成する」を参照してください。

セカンダリインスタンスが読み取りワークロードに使われていない限り、Microsoft はプライマリインスタンスと一致する数の無料仮想コアを提供します。その場合でも、セカンダリインスタンスで使われるコンピューティングとストレージについては課金されます。フェールオーバーグループでは、1 つのレプリカのみがサポートされます。そのレプリカは、読み取り可能なレプリカであるか、DR 専用レプリカとして指定されている必要があります。

システムデータベースのオブジェクトに依存するシナリオを実現させる

システムデータベースは、フェールオーバーグループのセカンダリインスタンスにはレプリケートされません。システムデータベースのオブジェクトに依存するシナリオを実現するには、セカンダリインスタンスに同じオブジェクトを作成し、プライマリインスタンスとの同期を維持する必要があります。

たとえば、セカンダリインスタンスで同じログインを使用する予定の場合は、必ず、同じ SID でそれらを作成してください。

-- Code to create login on the secondary instance
CREATE LOGIN foo WITH PASSWORD = '<enterStrongPasswordHere>', SID = <login_sid>;

詳細については、「ログインとエージェントジョブのレプリケーション」を参照してください。

インスタンスのプロパティと保持ポリシーのインスタンスを同期する

フェールオーバーグループ内のインスタンスは個別の Azure リソースを保持します。プライマリインスタンスの構成に対して行われた変更は、セカンダリインスタンスに自動的にレプリケートされません。プライマリインスタンスとセカンダリインスタンスの両方で、関連するすべての変更を実行する必要があります。たとえば、プライマリインスタンスでバックアップストレージの冗長性または長期的なバックアップ保持ポリシーを変更した場合は、セカンダリインスタンスでも必ず変更してください。

インスタンスのスケーリング

プライマリとセカンダリのインスタンスを、同じサービスレベル内の別のコンピューティングサイズ、または異なるサービスレベルにスケールアップまたはスケールダウンできます。同じサービスレベル内でスケールアップするときは、最初に geo セカンダリをスケールアップしてから、プライマリをスケールアップすることをお勧めします。同じサービスレベル内でスケールダウンするときは、順序を逆にします。つまり最初にプライマリをスケールダウンしてから、セカンダリをスケールダウンします。インスタンスを異なるサービスレベルにスケーリングするときは、この推奨事項が適用されます。この一連の操作は、サービスレベルと仮想コア、ストレージをスケーリングする場合に適用されます。

下位の SKU の geo セカンダリが過負荷になり、アップグレードまたはダウングレードプロセス中に再シードする必要があるという問題を回避するために、このシーケンスが特に推奨されます。

Note

関連するフェールオーバーグループリスナーを使用してスケーリングされるインスタンスのアクセシビリティに影響する可能性がある既知の問題があります。

重要なデータが失われないようにする

ワイドエリアネットワークの待機時間が長いため、geo レプリケーションは非同期レプリケーションメカニズムを使用します。非同期レプリケーションを使用すると、プライマリに障害が発生した場合にデータ損失が回避される可能性があります。重要なトランザクションをデータ損失から保護するために、アプリケーション開発者はトランザクションをコミットした直後に sp_wait_for_database_copy_sync ストアドプロシージャを呼び出すことができます。 sp_wait_for_database_copy_sync を呼び出すと、最後にコミットされたトランザクションが転送され、セカンダリデータベースのトランザクションログに書き込まれるまで、呼び出し元のスレッドがブロックされます。ただし、転送されたトランザクションがセカンダリで再生 (再実行) されるのを待つことはありません。 sp_wait_for_database_copy_sync は、特定の geo レプリケーションリンクにスコープが設定されています。プライマリデータベースへの接続権限を持つユーザーが、このプロシージャを呼び出すことができます。

ユーザーが開始した計画的な geo フェールオーバー中のデータ損失を防ぐために、レプリケーションが自動的かつ一時的に同期レプリケーションに変更されてから、フェールオーバーが実行されます。 geo フェールオーバーが完了すると、レプリケーションは非同期モードに戻ります。

Note

sp_wait_for_database_copy_sync は、特定のトランザクションの geo フェールオーバー後のデータ損失を防ぎますが、読み取りアクセスの完全同期は保証しません。 sp_wait_for_database_copy_sync プロシージャ呼び出しによって発生する遅延は大きくなる可能性があり、呼び出し時のプライマリでまだ転送されていないトランザクションログのサイズによって異なります。

フェールオーバーグループの状態

自動フェールオーバーグループは、データレプリケーションの現在の状態を説明するステータスを報告します。

シード処理 - フェールオーバーグループの作成後、すべてのユーザーデータベースがセカンダリインスタンスで初期化されるまで、初期シード処理が行われます。フェールオーバーグループがシード処理状態の間は、ユーザーデータベースはまだセカンダリインスタンスにコピーされていないため、フェールオーバープロセスは開始できません。
同期 - フェールオーバーグループの通常の状態。つまり、プライマリインスタンスでのデータ変更が、セカンダリインスタンスに非同期的にレプリケートされます。この状態では、データがすべての時点で完全に同期される保証はありません。フェールオーバーグループ内のインスタンス間のレプリケーションプロセスは非同期的な性質を持っていることから、プライマリからセカンダリにレプリケートされるデータ変更が引き続き発生する可能性があります。フェールオーバーグループが同期状態の間は、自動と手動の両方のフェールオーバーを開始できます。
フェールオーバーの進行中 - この状態は、自動でまたは手動で開始されたフェールオーバープロセスが進行中であることを示しています。フェールオーバーグループがこの状態の間は、フェールオーバーグループに対する変更や追加のフェールオーバーを開始することはできません。

フェールバック

フェールオーバーグループが自動マイクロソフトマネージドフェールオーバーポリシーを使って構成されていると、障害シナリオの間に、定義された猶予期間に従って、geo セカンダリサーバーへのフェールオーバーが開始されます。古いプライマリへのフェールバックは、手動で開始する必要があります。

トランザクションレプリケーションを使用したフェールオーバーグループ

フェールオーバーグループ内のインスタンスでのトランザクションレプリケーションの使用はサポートされています。ただし、SQL マネージドインスタンスをフェールオーバーグループに追加する前にレプリケーションが構成されている場合、フェールオーバーグループの作成を開始するとレプリケーションが一時停止し、レプリケーションモニターに Replicated transactions are waiting for the next log backup or for mirroring partner to catch up の状態が表示されます。レプリケーションは、フェールオーバーグループが正常に作成されると、再開されます。

パブリッシャーまたはディストリビューター SQL マネージドインスタンスがフェールオーバーグループに存在する場合、フェールオーバーが発生した後に、SQL マネージドインスタンス管理者が、古いプライマリ上のすべてのパブリケーションをクリーンアップして、新しいプライマリ上でそれらを再構成する必要があります。このシナリオで必要なアクティビティの手順については、「トランザクションレプリケーションガイド」を確認してください。

アクセス許可、制限事項、および前提条件

フェールオーバーグループの構成に進む前に、フェールオーバーグループの構成ガイドで、アクセス許可、制限事項、および前提条件の一覧を確認してください。

フェールオーバーグループをプログラムで管理する

フェールオーバーグループは、Azure PowerShell、Azure CLI、および REST API を使用してプログラムで管理することもできます。詳細については、フェールオーバーグループの構成に関するページを参照してください。

ディザスターリカバリーの訓練

DR ドリルを実行するには、フェールオーバーのチュートリアルに従って手動計画フェールオーバーの使用をお勧めします。

強制フェイルオーバーを使用してドリルを実行することは、推奨されません。この操作では、データ損失に対するガードレールが提供されないためです。ただし、強制フェイルオーバー前に以下の条件を満たすことで、データ損失のない強制フェイルオーバーが可能になります。

プライマリマネージドインスタンス上で実行されているワークロードが停止している。
実行時間の長いトランザクションがすべて完了した。
プライマリマネージドインスタンスへのすべてのクライアント接続が切断されている。
フェールオーバーグループの状態が "同期中"である。

必要に応じて、新しいプライマリマネージドインスタンスへの接続を確立し、読み取り/書き込みワークロードを開始する前に、2 つのマネージドインスタンスがロールを切り替え、フェールオーバーグループの状態が "フェールオーバー進行中" から "同期中" に切り替わったことを確認してください。

元のマネージドインスタンスロールに対してデータ損失のないフェールバックを実行するには、強制フェールオーバーではなく手動計画フェールオーバーを使用することを強くお勧めします。強制フェールバックを続行するには:

データロスレスフェイルオーバーと同じ手順に従います。
最初の強制フェールオーバーが完了した直後に強制フェールバックが実行された場合、以前のプライマリマネージドインスタンスで未処理の自動バックアップ操作が完了するのを待機する必要があるため、フェールバックの実行時間が長くなることが予想されます。

フェールオーバーグループの概要とベストプラクティス (Azure SQL Managed Instance)

概要

エンドポイントリダイレクト

読み取り専用ワークロードをオフロードする

アプリケーションの回復

フェールオーバーポリシー

お客様による管理

Microsoft マネージド

用語と機能

フェールオーバーグループのアーキテクチャ

geo セカンダリインスタンスを作成する

ペアリージョンを使用する

インスタンス間の geo レプリケーショントラフィックフローを有効にして最適化する

初期シード処理

geo セカンダリインスタンスへの geo フェールオーバーを管理する

読み取り/書き込みリスナーを使用する (プライマリ MI)

読み取りリスナーを使用する (セカンダリ MI)

フェールオーバー後のパフォーマンス低下の可能性

強制フェールオーバー後のデータ損失の可能性

DNS の更新

ライセンスフリーの DR レプリカでコストを節約する

システムデータベースのオブジェクトに依存するシナリオを実現させる

インスタンスのプロパティと保持ポリシーのインスタンスを同期する

インスタンスのスケーリング

重要なデータが失われないようにする

フェールオーバーグループの状態

フェールバック

トランザクションレプリケーションを使用したフェールオーバーグループ

アクセス許可、制限事項、および前提条件

フェールオーバーグループをプログラムで管理する

ディザスターリカバリーの訓練

フィードバック

フィードバック

その他のリソース

フェールオーバー グループの概要とベスト プラクティス (Azure SQL Managed Instance)

概要

エンドポイント リダイレクト

読み取り専用ワークロードをオフロードする

アプリケーションの回復

フェールオーバー ポリシー

お客様による管理

Microsoft マネージド

用語と機能

フェールオーバー グループのアーキテクチャ

geo セカンダリ インスタンスを作成する

ペアリージョンを使用する

インスタンス間の geo レプリケーション トラフィック フローを有効にして最適化する

初期シード処理

geo セカンダリ インスタンスへの geo フェールオーバーを管理する

読み取り/書き込みリスナーを使用する (プライマリ MI)

読み取りリスナーを使用する (セカンダリ MI)

フェールオーバー後のパフォーマンス低下の可能性

強制フェールオーバー後のデータ損失の可能性

DNS の更新

ライセンスフリーの DR レプリカでコストを節約する

システム データベースのオブジェクトに依存するシナリオを実現させる

インスタンスのプロパティと保持ポリシーのインスタンスを同期する

インスタンスのスケーリング

重要なデータが失われないようにする

フェールオーバー グループの状態

フェールバック

トランザクション レプリケーションを使用したフェールオーバー グループ

アクセス許可、制限事項、および前提条件

フェールオーバーグループをプログラムで管理する

ディザスター リカバリーの訓練

関連するコンテンツ

フィードバック

フィードバック

その他のリソース

フェールオーバーグループの概要とベストプラクティス (Azure SQL Managed Instance)

エンドポイントリダイレクト

フェールオーバーポリシー

フェールオーバーグループのアーキテクチャ

geo セカンダリインスタンスを作成する

インスタンス間の geo レプリケーショントラフィックフローを有効にして最適化する

geo セカンダリインスタンスへの geo フェールオーバーを管理する

システムデータベースのオブジェクトに依存するシナリオを実現させる

フェールオーバーグループの状態

トランザクションレプリケーションを使用したフェールオーバーグループ

ディザスターリカバリーの訓練