アラートと自動アクションを計画する

この記事では、Azure Monitor のアラートに関するガイダンスを提供します。 アラートを使用すると、監視データで識別された重要なデータやパターンが事前に通知されます。 アラートは、Azure portal で表示できます。 次のようなアラートを作成できます。

  • 事前通知を送信する。
  • 問題の修復を試みる自動アクションを開始する。

アラート戦略

アラート戦略では、次のような組織の標準を定義します。

  • さまざまなシナリオに対して作成するアラート ルールの種類。
  • 作成したアラートを分類および管理する方法。
  • アラートに応じて実行する自動アクションと通知。

アラート戦略を定義すると、アラートの重要度やアクション グループなどのアラート ルールの構成を定義する際に役立ちます。

アラート戦略を作成する際に考慮すべき要素については、「適切なアラート戦略」を参照してください。

アラート ルールの種類

Azure Monitor のアラートは、アラート ルール (ご自身で作成する必要があります) によって作成されます。 推奨されるアラート ルールのガイダンスについては、各 Azure サービスの監視に関するドキュメントを参照してください。 既定では、Azure Monitor にはアラート ルールが用意されていません。

複数の種類のアラート ルールが、使用するデータの種類によって定義されています。 それぞれの機能は異なり、コストが異なります。 基本的な戦略は、必要なロジックが提供される最低コストのアラート ルールの種類を使用することです。

  • アクティビティ ログのルール。 指定した条件と一致する新しいアクティビティ ログ イベントへの応答として、アラートを作成します。 これらのアラートにはコストはかからないので、最初にこれらを選択してください。ただし、検出できる条件は限られます。 アクティビティ ログ アラートの作成については、「アラート ルールの作成または編集」 を参照してください。
  • メトリックの警告ルール。 しきい値を超えた 1 つまたは複数のメトリック値に応答して、警告を作成します。 メトリック アラートはステートフルであり、値がしきい値を下回るとアラートは自動的に閉じられ、状態が変化したときにだけ通知が送信されます。 メトリック アラートにはコストがかかりますが、多くの場合、ログ検索アラートより大幅に低くなります。 メトリックアラートの作成については、「アラート ルールの作成または編集」 を参照してください。
  • ログ検索アラート ルール。 スケジュール クエリの結果が指定した条件と一致した場合に、アラートが作成されます。 これらは、アラート ルールの中で最も高価なものですが、最も複雑な条件を指定できます。 ログ検索クエリ アラートの作成については、「アラート ルールの作成または編集」を参照してください。
  • アプリケーション アラート。 Web アプリのプロアクティブなパフォーマンスと可用性テストを実行します。 ping テストは無料で実行できますが、より複雑なテストにはコストがかかります。 さまざまなテストの説明と作成方法については、「任意の Web サイトの可用性を監視する」を参照してください。

アラートの重大度

各アラート ルールでは、それによって作成されるアラートの重要度が、以下の表に基づいて定義されます。 Azure portal 内のアラートはレベル別にグループ化されるため、同様のアラートをまとめて管理し、緊急度が最も高いアラートを迅速に特定できます。

Level 名前 説明
重大度 0 Critical サービスまたはアプリケーションの可用性が失われるか、パフォーマンスが大幅に低下します。 即時の対応が必要です。
重大度 1 エラー アプリケーションまたはサービスの一部の側面のパフォーマンスが低下するか可用性が失われます。 対応が必要ですが、即時ではありません。
重大度 2 警告 現時点で可用性やパフォーマンスが失われることはありませんが、解決されないと、より深刻な問題につながるおそれがある問題です。
重大度 3 Informational 問題を示すものではなく、通常のプロセスの正常な完了など、オペレーターが必要とする情報を示します。
重大度 4 "詳細" 問題は示されませんが、詳細な情報が提供されます。

各ルールで識別される条件の重要度を評価し、適切なレベルを割り当てます。 各重要度レベルに割り当てる問題の種類およびそれぞれに対する標準的な対応は、アラート戦略で定義します。

アクション グループ

Azure Monitor のアラートへの自動応答は、アクション グループで定義します。 アクション グループは、アラートがトリガーされると起動される、1 つ以上の通知とアクションのコレクションです。 1 つのアクション グループは複数のアラート ルールで使用でき、次の項目を 1 つ以上含めることができます。

  • 通知: アラートが作成されたことをオペレーターと管理者に通知するメッセージ。
  • アクション: 検出された問題の修正を試みる自動化プロセス。

通知

通知は、アラートが作成されたことを 1 人以上のユーザーに通知するために送信されるメッセージです。 1 つのアクション グループを複数のアラート ルールで使用できるので、同じアラート セットを受け取る複数の異なる管理者とユーザーのセット向けにアクション グループ セットを設計する必要があります。 オペレーターと組織の標準の設定に応じて、次のいずれかの通知の種類を使用します。

  • Email
  • SMS
  • Azure アプリへのプッシュ
  • 音声
  • 電子メールの Azure Resource Manager のロール

アクション

アクションは、アラートに対する自動応答です。 用意されているアクションをそれらがサポートする任意のシナリオで使用できますが、以下のセクションでは、各アクションが通常どのように使用されるかについて説明します。

自動修復

次のアクションを使用して、アラートによって特定された問題の自動修復を試みます。

  • Automation Runbook: Azure Automation で組み込みの Runbook またはカスタムの Runbook を開始します。 たとえば、組み込みの Runbook は、仮想マシンの再起動やスケールアップなどの機能を実行する場合に使用できます。
  • Azure Functions: Azure 関数を開始します。

ITSM とオンコール管理

  • IT サービスマネジメント (ITSM): ITSM Connector を使用して、Azure Monitor からのアラートに基づいて ITSM ツールで作業項目を作成します。 最初にコネクタを構成してから、アラート ルールで ITSM アクションを使用します。
  • Webhook: PagerDuty や Splunk On-Call などの Webhook をサポートするインシデント管理システムにアラートを送信します。
  • セキュリティで保護された Webhook: ITSM を Microsoft Entra 認証と統合します。

アラート アクティビティを最小化する

環境内の重要な情報に関するアラートを作成する場合があります。 ただし、それらを必要としない問題に対して過剰なアラートや通知を作成することは望まれません。 アラート アクティビティを最小化し、重大な問題を明らかにしつつ、管理者向けに過剰な情報と通知を生成しないようにするには、これらのガイドラインに従ってください。

  • ある症状がアラートの適切な候補であるかどうかを判断するには、「適切なアラート戦略」を参照してください。
  • 条件が修正された場合にアラートを解決するには、メトリック アラート ルールの [Automatically resolve alerts](アラートを自動的に解決する) オプションを使用します。
  • 同じ問題に対して複数のアラートが作成されるのを防ぐには、ログ検索警告ルールの [アラートを表示しない] オプションを使用します。
  • アラート ルールで適切な重要度レベルを使用して、優先度の高い問題をまとめて分析できるようにします。
  • 重要度が警告以下のアラートの場合、即時の対応を必要としないため、通知を制限します。

アラート ルールを大規模に作成する

通常は、すべてのクリティカルな Azure アプリケーションとリソースに関する問題についてアラートを生成する必要があるます。 大規模なアラート ルールを作成するには、次の方法を使用します。

  • Azure Monitor では、同じ Azure リージョンに存在するリソースに対して、1 つのメトリック アラート ルールを使用した、同じ種類の複数リソースの監視がサポートされます。 この機能で現在サポートされている Azure サービスの一覧については、「Azure Monitor のメトリック アラートでサポートされるリソース」を参照してください。
  • 複数のリソースをサポートしない Azure サービスのメトリック アラート ルールの場合は、Azure CLI や PowerShell などの自動化ツールを Resource Manager テンプレートと共に使用して、複数のリソースに対して同じアラート ルールを作成します。 サンプルについては、「Azure Monitor のメトリック アラート ルール用の Resource Manager テンプレート サンプル」を参照してください。
  • 複数のリソースのデータが返されるようにするには、ログ検索警告ルールでクエリを記述します。 ルールの [Split by dimensions](ディメンションによる分割) 設定を使用して、リソースごとに個別のアラートを作成します。

Note

現在パブリック プレビュー段階にあるリソース中心のログ検索警告ルールを使用すると、サブスクリプションまたはリソース グループ内のすべてのリソースをログ検索アラートのターゲットとして使用できます。

次のステップ

Azure Monitor でコストを最適化する