Site Recovery の監視

この記事では、Azure Site Recovery を、Site Recovery に組み込まれている監視機能を使用して監視する方法について説明します。 以下を監視できます。

  • Site Recovery によってレプリケートされたマシンの正常性と状態。
  • マシンのテスト フェールオーバーの状態。
  • 構成とレプリケーションに影響する問題とエラー。
  • オンプレミス サーバーなどのインフラストラクチャ コンポーネント。

開始する前に

開始する前に、監視に関する一般的な質問を確認することをお勧めします。

ダッシュボードでの監視

  1. コンテナーで [概要] を選択します。 Recovery Services ダッシュボードには、コンテナーのすべての監視情報が 1 か所にまとめられています。 Site Recoveryサービスと Azure Backup サービス には、どちらにも専用のページがあり、それらを切り替えることができます。

    スクリーンショットには Site Recovery ダッシュボードが表示されています。

  2. ダッシュボードから、さまざまな領域にドリルダウンすることができます。

    スクリーンショットには、ドリルダウンできるダッシュボード上の領域が表示されています。

  3. [レプリケートされたアイテム][すべて表示] を選択すると、コンテナー内のすべてのサーバーが表示されます。

  4. ドリルダウンするには、各セクションの状態の詳細を選択します。

  5. [インフラストラクチャ ビュー] では、レプリケートされているマシンの種類ごとに監視情報を並べ替えます。

レプリケートされたアイテムの監視

[レプリケートされたアイテム] セクションでは、レプリケーションが有効にされているコンテナー内のすべてのマシンの正常性を監視します。

State 詳細
Healthy レプリケーションは正常に進行しています。 エラーや警告の症状は検出されていません。
警告 レプリケーションに影響を及ぼす可能性がある警告の症状が少なくとも 1 件検出されています。
Critical 重大なレプリケーション エラーの症状が少なくとも 1 件検出されました。

これらのエラー症状は、通常、レプリケーションがスタックしていること、またはデータ変更速度に処理速度が追い付いていないことを示します。
適用なし 現在、サーバーはレプリケートを行っていないものと思われます。 たとえば、マシンがフェールオーバーされた可能性があります。

テスト フェールオーバーの監視

[フェールオーバー テスト成功] では、コンテナー内のマシンのフェールオーバーの状態を監視します。

  • レプリケートされたマシンについて、少なくとも半年に 1 回はテスト フェールオーバーを実行することをお勧めします。 それによって、フェールオーバーが想定どおりに機能し、運用環境の中断が発生していないことを確認できます。
  • フェールオーバーとその後のクリーンアップが正常に完了したときにはじめて、テスト フェールオーバーが成功したと見なされます。
State 詳細
テストをお勧めします このマシンは、保護が有効にされてから、まだテスト フェールオーバーが実施されていません。
正常に実行されました このマシンは、テスト フェールオーバーが少なくとも 1 回成功しています。
適用なし このマシンは現在、テスト フェールオーバーの対象ではありません。 たとえばフェールオーバーされたマシンや、初回レプリケーション/テスト フェールオーバー/フェールオーバーが進行中のマシンが該当します。

構成の問題の監視

[構成の問題] では、正常にフェールオーバーする機能に影響する可能性があるすべての問題を監視します。

  • 構成の問題 (ソフトウェア更新プログラムの提供状況を除く) は、既定では 12 時間ごとに実行される定期的な検証コントロール操作によって検出されます。 "構成の問題" のセクション見出しの横にある更新アイコンを選択することにより、検証コントロール操作を強制的にすぐ実行できます。
  • リンクを選択すると詳細情報が表示されます。 特定のマシンに影響を及ぼす問題については、[ターゲット構成] 列の [要注意] を選択します。 この詳細情報には、修復に関するアドバイスが含まれます。
State 詳細
不足している構成 復旧ネットワーク、リソース グループなど、必要な設定が不足しています。
不足しているリソース 指定されたリソースが見つからないか、サブスクリプションで利用できません。 たとえばリソースが削除されているか、移行されています。 監視対象リソースには、ターゲット リソース グループ、ターゲット VNet/サブネット、ログ/ターゲット ストレージ アカウント、ターゲットの可用性セット、ターゲット IP アドレスが含まれていました。
サブスクリプション クォータ 使用可能なサブスクリプション リソース クォータの残量が、コンテナー内のすべてのマシンをフェールオーバーするために必要な残量と比較されます。

リソースが不足していると、クォータ残量不足が報告されます。

VM のコア数、VM ファミリのコア数、ネットワーク インターフェイス カード (NIC) の数がクォータによって監視されます。
ソフトウェア更新プログラム 新しいソフトウェア更新プログラムの提供状況、ソフトウェア バージョンの期限切れに関する情報です。

エラーを監視する

[エラーの概要] では、コンテナー内のサーバーのレプリケーションに影響を及ぼす可能性がある現在アクティブなエラーの症状を監視し、影響を受けているマシンの数を監視します。

  • このセクションの先頭には、オンプレミスのインフラストラクチャ コンポーネントに影響を及ぼしているエラーが表示されます。 たとえば、オンプレミスの構成サーバー上の Azure Site Recovery プロバイダーまたは Hyper-V ホスト からハートビートが受信されていないことが示されます。
  • 次に、レプリケート対象サーバーに影響を与えているレプリケーション エラーの症状が表示されます。
  • テーブルのエントリは、最初にエラーの重大度の高い順に、次に影響を受けたマシンの数の多い順に、並べ替えられます。
  • 影響を受けているサーバーの数は、基になる 1 つの問題が複数のマシンに影響している可能性があるかどうかを理解するのに役立ちます。 たとえば、ネットワークの不具合によって、Azure にレプリケートされるすべてのマシンが影響を受ける可能性があります。
  • 1 台のサーバーで複数のレプリケーション エラーが発生する場合があります。 その場合、そのサーバーは、影響を受けるサーバーの一覧でエラーの症状ごとにカウントされます。 問題が解決すると、レプリケーション パラメーターは改善し、マシンからエラーがクリアされます。

インフラストラクチャの監視

[インフラストラクチャ ビュー] では、レプリケーションに関係するインフラストラクチャ コンポーネントと、サーバーと Azure サービス間の接続の正常性を監視します。

  • 緑色の線は、接続が正常な状態であることを示します。

  • エラー アイコンが重ねて表示されている赤い線は、接続性に影響するエラー症状が少なくとも 1 つ存在することを示します。

  • エラー アイコンをマウス ポインターでポイントすると、エラーと影響を受けるエンティティの数が表示されます。影響を受けるエンティティのフィルター処理された一覧を表示するには、アイコンをクリックします。

    スクリーンショットには、Site Recovery のインフラストラクチャ ビュー (コンテナー) が表示されています。

インフラストラクチャを監視するためのヒント

  • オンプレミスのインフラストラクチャ コンポーネント (構成サーバー、プロセス サーバー、VMM サーバー、Hyper-V ホスト、VMware マシン) で、Site Recovery プロバイダーまたは Site Recovery エージェントの最新バージョンが実行されていることを確認してください。

  • インフラストラクチャ ビューのすべての機能を使用するためには、これらのコンポーネントで更新プログラムのロールアップ 22 が実行されている必要があります。

  • インフラストラクチャ ビューを使用するためには、実際の環境に合った適切なレプリケーション シナリオを選んでください。 ビューをドリルダウンすることで、より詳しい情報を把握できます。 表示されるシナリオを次の表に示します。

    シナリオ State 表示可能
    オンプレミス サイト間のレプリケーション すべての状態 いいえ
    Azure リージョン間の Azure VM レプリケーション レプリケーション有効/初期レプリケーション進行中 はい
    Azure リージョン間の Azure VM レプリケーション フェールオーバー済み/フェールバック いいえ
    Azure への VMware レプリケーション レプリケーション有効/初期レプリケーション進行中 はい
    Azure への VMware レプリケーション フェールオーバー済み/フェールバック いいえ
    Azure への Hyper-V のレプリケーション フェールオーバー済み/フェールバック いいえ
  • レプリケートするマシンが 1 つの場合にインフラストラクチャ ビューを表示するには、コンテナー メニューの [レプリケートされたアイテム] を選択してサーバーを選択します。

復旧計画の監視

[復旧計画] では、計画の数の監視、新しい計画の作成、および既存の計画の編集を行います。

ジョブの監視

[ジョブ] では、Site Recovery 操作の状態を監視します。

  • Azure Site Recovery のほとんどの操作は非同期的に実行され、操作の進行状況を追跡するために追跡ジョブが作成されて使用されます。
  • ジョブ オブジェクトは、操作の状態と進行状況を追跡するために必要なすべての情報を持っています。

ジョブは次のように監視します。

  1. [dashboard](ダッシュボード) >[Jobs](ジョブ) セクションで、完了したジョブ、進行中のジョブ、入力を待っているジョブの概要を、直近 24 時間分見ることができます。 いずれかの状態を選択すると、関連するジョブについてさらに詳しい情報を入手できます。

  2. [すべて表示] を選択すると、直近 24 時間のすべてのジョブが表示されます。

    Note

    コンテナー メニューの >[Site Recovery Jobs](Site Recovery ジョブ) からもジョブの情報にアクセスできます。

  3. [Site Recovery ジョブ] リストに、ジョブの一覧が表示されます。 トップ メニューで、特定のジョブのエラーの詳細を把握したり、特定の条件でジョブの一覧をフィルター処理したり、選択されたジョブの詳細を Excel にエクスポートしたりすることができます。

  4. ジョブを選択すると、さらに詳しい情報を表示できます。

仮想マシンの監視

  1. [レプリケートされたアイテム] には、レプリケートされたマシンの一覧が表示されます。

    スクリーンショットには、Site Recovery のレプリケートされた項目のリスト ビューが表示されています。

  2. 情報の表示とフィルター処理を行うことができます。 上部のアクション メニューでは、特定のマシンを対象に操作を実行することができます (テスト フェールオーバーの実行、特定のエラーの表示など)。

  3. RPO、ターゲット構成の問題、レプリケーション エラーなど、他の列を表示するには、[列] を選択します。

  4. レプリケーションの正常性、特定のレプリケーション ポリシーなど、特定のパラメーターに基づいて情報を表示するには、[フィルター] を選択します。

  5. テスト フェールオーバーなどの操作を開始したり、関連付けられている特定のエラーの詳細を確認したりするには、その対象となるマシンを選択します。

  6. いずれかのマシンを選択すると、さらに詳しい情報が表示されます。 詳細には次のものが含まれます。

    • レプリケーション情報:マシンの現在の状態と正常性。
    • RPO (復旧ポイントの目標):仮想マシンの現在の RPO と、RPO が最後に計算された日時。
    • 復旧ポイント:マシンの利用可能な最新の回復ポイント。
    • フェールオーバーの準備:対象のマシンに関してテスト フェールオーバーが実行されたかどうかや、マシン上で実行されているエージェントのバージョン (モビリティ サービスを実行しているマシンの場合)、構成上の問題を示します。
    • エラー:現在マシンで観察されているレプリケーション エラーの症状と考えられる原因/対策の一覧。
    • イベント:マシンに影響を与える最近のイベントの時系列での一覧。 エラーの詳細が、現在観察できるエラーの症状を示しているのに対し、イベントは、マシンに影響を与えた問題の履歴レコードになります。
    • インフラストラクチャ ビュー:Azure にマシンをレプリケートするシナリオに関して、インフラストラクチャの状態を表示します。

    スクリーンショットには、Site Recovery の仮想マシン項目のリスト ビューが表示されています。

電子メール通知に登録する

次に示したような重大なイベントに関して、メール通知の受け取りを登録することができます。

  • レプリケートされたマシンが重大な状態に陥った。
  • オンプレミスのインフラストラクチャ コンポーネントと Site Recovery サービスとの間の接続が失われた。 コンテナーに登録されているオンプレミス サーバーと Site Recovery との間の接続は、ハートビート機構を使って検出されます。
  • フェールオーバーに失敗した。

登録の手順は次のとおりです。

コンテナー >[監視] セクションで、[Site Recovery イベント] を選択します。

  1. [メール通知] を選択します。

  2. [電子メールの通知] で通知をオンにし、送信先を指定します。 すべてのサブスクリプション管理者に通知を送信できるほか、必要に応じて特定のメール アドレスを対象にすることもできます。

    スクリーンショットには、[電子メール通知] ビューが表示されています。

Azure Site Recovery に関する組み込みの Azure Monitor アラート (プレビュー)

Azure Site Recovery では、Azure Monitor を介して既定のアラートを提供し、さまざまな Azure サービス間で一貫したアラート管理エクスペリエンスを得られるようにします。 Azure Monitor ベースのアラートを使用すると、Azure Monitor でサポートされている通知チャネル (電子メール、Webhook、ロジック アプリなど) にアラートをルーティングできます。 また、計画メンテナンス期間中の通知を抑制するなど、Azure Monitor で提供されるその他のアラート管理機能を使用することもできます。

組み込みの Azure Monitor アラートを有効にする

特定のサブスクリプションで、Azure Site Recovery 向けに組み込みの Azure Monitor アラートを有効にするには、Azure portal[プレビュー機能] を開き、該当するサブスクリプションの機能フラグ EnableAzureSiteRecoveryAlertsToAzureMonitor を登録します。

Note

  • 登録が有効になるまで 24 時間待機してから、機能をテストすることをお勧めします。
  • サブスクリプションが登録される前に Recovery Services コンテナーが作成された場合は、サブスクリプションを再登録する必要があります。

スクリーンショットには、アラート機能に登録する機能フラグが表示されています。

アラートのシナリオ

この機能を登録したら、次のいずれかの重大イベントが発生するたびに、Azure Site Recovery は既定のアラート (Azure Monitor を介して表示される) を送信します。

  • Azure VM、Hyper-V、VMware レプリケーションのディザスター リカバリーの失敗アラートの有効化
  • Azure VM、Hyper-V、VMware レプリケーションの、レプリケーションの正常性に関する重大な問題のアラート
  • Azure VM および Hyper-V レプリケーションの Azure Site Recovery エージェント バージョンの期限切れアラート
  • Hyper-V レプリケーションの "Azure Site Recovery エージェントに接続できません" アラート
  • Azure VM、Hyper-V、VMware レプリケーションのフェールオーバー失敗アラート
  • Azure VM レプリケーションの自動認定期限切れアラート

Azure Site Recovery を使用してテスト VM のアラートの動作をテストするには、キャッシュ ストレージ アカウントのパブリック ネットワーク アクセスを無効にし、"レプリケーションの正常性に重大な問題があります" アラートが生成されるようにします。 "アラート" は、ルールの構成なしで既定で生成されます。 しかし、生成されたアラートに対する "通知" (メール通知など) を有効にするには、次のセクションで説明するように、アラート処理ルールを作成する必要があります。

生成された Azure Site Recovery アラートを Azure Monitor で表示する

アラートが生成されると、Azure Monitor ポータルで表示し、管理できるようになります。 次の手順のようにします。

  1. Azure portal[Azure Monitor]>[アラート] に移動します。
  2. [サービスの監視] = [Azure Site Recovery] のフィルターを設定し、Azure Site Recovery 固有のアラートを表示します。 他のフィルターの値をカスタマイズし、特定の時間範囲 (最大 30 日) のアラート、コンテナーやサブスクリプションのアラート、重大度およびアラートの状態 (ユーザー応答) を表示することもできます。
  3. いずれかのアラートを選択すると、詳細を確認できます。 たとえば、影響を受ける VM、考えられる原因、推奨される操作などです。
  4. イベントが軽減されたら、その状態を [終了][確認済み] に変更できます。

スクリーンショットには、ポータルの Azure Monitor を介したアラート表示が示されています。

生成された Azure Site Recovery アラートを Recovery Services コンテナーで表示する

特定のコンテナーに対して生成されたアラートを、コンテナー エクスペリエンスを介して表示するには、次の手順に従います。

  1. Azure portal で、使用している Recovery Services コンテナーに移動します。
  2. [アラート] セクションを選択し、[サービスの監視] = [Azure Site Recovery] のフィルターを設定して、Azure Site Recovery 固有のアラートを表示します。 他のフィルターの値をカスタマイズし、特定の時間範囲 (最大 30 日) のアラート、コンテナーやサブスクリプションのアラート、重大度およびアラートの状態 (ユーザー応答) を表示できます。
  3. いずれかのアラートを選択すると、影響を受ける VM、考えられる原因、推奨される操作などの詳細を確認できます。
  4. イベントが軽減されたら、その状態を [終了][確認済み] に変更できます。

スクリーンショットには、ポータルの Recovery Services コンテナーを介したアラートが表示されています。

アラートの電子メール通知を構成する

Azure Site Recovery 向けに、組み込みの Azure Monitor アラートの電子メール通知を構成するには、Azure Monitor でアラート処理ルールを作成する必要があります。 アラート処理ルールは、特定の通知チャネル (アクション グループ) に対して送信するアラートを指定します。

アラート処理ルールを作成するには、次の手順に従います。

  1. [Azure Monitor]>[アラート] の順に選択し、上部のウィンドウで [アラート処理ルール] を選択します。

    スクリーンショットには、Azure Monitor の [アラート処理ルール] オプションが表示されています。

  2. [作成] を選択します

    スクリーンショットには、新しいアラート処理ルールの作成が示されています。

  3. アラート処理ルールの [スコープ]>[スコープの選択] で、サブスクリプション内のすべてのリソースにルールを適用できます。 フィルターを適用すると、スコープに対して他のカスタマイズも行えます。 たとえば、特定の重要度のアラートに対して通知を生成することもできます。

    スクリーンショットには、アラート処理ルールのスコープの選択が示されています。

  4. [ルールの設定][アクション グループの適用][アクション グループの作成] を選択します (または既存のアクション グループを使用します)。 アクション グループは、アラートの通知の送信先です。 たとえば、メール アドレスです。

    スクリーンショットには、新しいアクション グループの作成オプションが表示されています。

  5. アクション グループの作成において、[基本] タブでアクション グループの名前、サブスクリプション、そのグループを作成するリソース グループを選択します。

    スクリーンショットには、アクション グループを作成することによる通知の構成が示されています。

  6. [通知] タブで、通知の送信先として [電子メール/SMS メッセージ/プッシュ/音声] を選択し、受信者の電子メール ID と、その他の情報を必要に応じて入力します。

    スクリーンショットには、必要な通知チャネルの選択オプションが表示されています。

  7. [確認と作成]>[作成] を選択してアクション グループをデプロイします。 アクション グループを作成すると、アラート処理ルールの作成に戻ります。

    Note

    作成されたアクション グループは [ルール設定] ページに表示されます。

  8. [スケジュール] タブで [常に] を選択します。

    スクリーンショットには、アラート処理ルールのスケジュール オプションが表示されています。

  9. [詳細] タブで、アラート処理ルールを作成する対象のサブスクリプションとリソース グループを指定し、作成するルールの名前も指定します。

    スクリーンショットには、任意のサブスクリプションでのアラート処理ルールの保存が示されています。

  10. 必要に応じてタグを追加し、[確認と作成]>[作成] の順に選択します。 アラート処理ルールは数分以内にアクティブになります。

電子メール以外のチャネルの通知を構成する

Azure Monitor アクション グループでは、Webhook、ロジック アプリ、関数などの他の通知チャネルにアラートをルーティングできます。 Azure Monitor でサポートされているアクション グループの詳細に関する記事を参照してください。

プログラマティック インターフェイスを介して通知を構成する

Azure Monitor でサポートされている次のインターフェイスを使用して、アクション グループとアラート処理ルールを管理できます。

計画メンテナンス期間中の通知を抑制する

メンテナンス期間のように、Azure Site Recovery の操作が失敗することが予想されるシナリオがあります。 そのような期間中に通知を抑制する要件がある場合は、抑制アラート処理ルールを設定し、それを特定の期間に実行できます。

抑制アラート処理ルールを作成するには、前のセクションで説明した通知ベースのアラート処理ルールと同じ手順を実行しますが、以下の違いがあります。

  1. [ルールの設定] で、[通知を表示しない] を選択します。 同じスコープに対して、抑制アラート処理ルールとアクション グループ アラート処理ルールの両方が適用されている場合、抑制ルールが優先されます。

    スクリーンショットには、通知抑制の有効化が示されています。

  2. [スケジュール] で、アラートを抑制する期間を入力します。

    スクリーンショットには、通知抑制のスケジュール時間枠が表示されています。

価格

組み込みの Azure Monitor アラートでは、重大な操作や失敗のアラートは既定で作成されます。 これらのアラートはポータルか、ポータル以外のインターフェイスを介して表示できます。追加料金は発生しません。 ただし、これらのアラートを通知チャネル (電子メールなど) にルーティングする場合、Free レベル (1 か月あたり 1,000 メール) を超える通知に対してはわずかなコストが発生します。 Azure Monitor の価格を確認する。

次のステップ

Azure Monitor を使用した Site Recovery の監視について確認します。