トレーニング
モジュール
Azure Monitor アラートを使用したインシデント対応の向上 - Training
Azure Monitor アラートを使用して、インフラストラクチャ内のインシデントとアクティビティに対応します。
このブラウザーはサポートされなくなりました。
Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。
この記事では、Azure Monitor のメトリック アラートに関する一般的な質問とそのトラブルシューティングの方法について説明します。
Azure Monitor のアラートは、監視データで重要な状態が見つかると事前に通知します。 管理者は、その通知を見て、システムのユーザーが問題に気付く前に問題を識別して対処できます。 アラートの詳細については、「Microsoft Azure のアラートの概要」を参照してください。
メトリック警告が発生するはずなのに発生せず、Azure portal に一覧表示されていない場合は、次の手順を試してください。
次のメトリック警告ルールの構成を確認します。
[集計の種類] と [集約粒度 (期間)] が、想定どおりに構成されていることを確認します。 [集計の種類] によって、メトリック値の集計方法が決まります。 詳細については、「Azure Monitor メトリックによる集計と表示の説明」をご覧ください。 [集約粒度 (期間)] により、アラート ルールが実行されるたびに評価でメトリック値をどこまで遡って集計するかが制御されます。
[しきい値] または [感度] が、想定どおりに構成されていることを確認します。
動的しきい値を使用するアラート ルールについては、詳細設定が構成されているかどうかを確認します。 [違反の数] によってアラートがフィルター処理される可能性があり、[次よりも前のデータを無視します] が、しきい値の計算方法に影響する場合があります。
注意
動的しきい値がアクティブになるためには、少なくとも 3 日の期間と、30 個のメトリック サンプルが必要です。
警告は発生したが、通知が送信されなかったかどうかを確認します。
発生した警告のリストを調べて、発生した警告が見つかるかどうかを確認します。 リストにアラートがあっても、そのアクションまたは通知の一部に問題がある場合は、「Azure Monitor のアラートの問題のトラブルシューティング」を参照してください。
警告が既にアクティブであるかどうかを確認します。
警告が発生すると予想されるメトリックの時系列で、警告が既に発生しているかどうかを確認します。 既定では、メトリック アラートはステートフルです。つまり、特定のメトリックの時系列でアラートが発生すると、問題が検出されなくなるまで、その時系列ではそれ以上のアラートは発生しません。 このような設計により、ノイズが減少します。 連続する 3 回の評価においてアラート条件が満たされない場合、アラートは自動的に解決されます。
使用されているディメンションを確認します。
1 つのメトリックに対してディメンション値を複数選択した場合、警告ルールでは、(ディメンション値の組み合わせによって定義される) メトリックの時系列ごとに、しきい値の違反が監視されます。 ディメンションが選択されていない集計メトリック時系列も監視するには、ディメンションを選択せずに、メトリックに対して別のアラート ルールを構成します。
集計と時間の細分性を確認します。
メトリック グラフを使用している場合は、次のことを確認します。
警告ルールに時系列の最初の評価期間がないかどうかを確認します。
以下のような場合に、[評価の頻度] よりも大きい [集計の細分性 (期間)] を選択するよう徹底することで、追加された時系列の最初の評価を見落とす可能性を減らすことができます。
メトリック アラートは既定ではステートフルであるため、特定の時系列に対して既にアラートが発生している場合、その他のアラートは発生しません。 特定のメトリック警告ルールをステートレスにして、警告の条件が満たされているすべての評価について警告を受け取る場合は、これらのいずれかのオプションを使用します。
たとえば、Azure Resource Manager、PowerShell、REST、または Azure CLI を使用して、プログラムでアラート ルールを作成する場合は、autoMitigate
プロパティを False
に設定します。
Azure portal を使用して警告ルールを作成する場合は、[警告ルールの詳細] セクションで [警告を自動的に解決する] オプションをオフにします。 ステートレス メトリック アラートの通知の頻度は、アラート ルールで構成された頻度によって異なります。
アラートの頻度が 5 分未満: 条件が継続して満たされている間、1 分から 6 分の間に通知が 1 回送信されます。
アラートの頻度が 5 分を超える: 条件が継続して満たされている間、構成された頻度とその頻度の 2 倍の間で通知が 1 回送信されます。 たとえば、頻度が 15 分のアラート ルールの場合、通知は 15 分から 30 分の間のどこかで送信されます。
注意
メトリック アラート ルールをステートレスにすると、発生したアラートが解決されなくなります。 そのため、条件が満たされなくなった後も、発生したアラートは 30 日の保有期間まで発生状態のままになります。
感度を高く構成していたとしても、動的しきい値を使用するアラート ルールの発動頻度が少なく、感度の高さが十分でないことがあります。 これは、メトリックの分布の不規則性が高いときに発生することがあります。 問題を解決するために、次のいずれかの解決策を検討します。
メトリック警告が発生してはならないことが確実な場合に発生した場合は、次の手順が問題の解決に役立つことがあります。
発生したアラートのリストを調べて、発生したアラートを見つけます。 詳細を表示するアラートを選択します。 [このアラートが発生した理由] で提供される情報を調べて、アラートがトリガーされた時点でのメトリック グラフ、[メトリック値]、および [しきい値] を確認します。
注意
動的しきい値を使用しており、しきい値が正しくないと思われる場合は、しかめっ面アイコンを使って、フィードバックをお寄せください。 このフィードバックは、機械学習のアルゴリズムの研究に影響を与え、将来の検出の改善に役立ちます。
1 つのメトリックに複数のディメンション値を選択した場合は、(ディメンション値の組み合わせによって定義される) メトリック時系列の ''いずれか'' がしきい値を超えるとアラートがトリガーされます。 メトリック警告でのディメンションの使用の詳細については、「ディメンションを使用してターゲットを絞り込む」を参照してください。
アラート ルールの構成を調べて、適切に構成されていることを確認します。
注意
動的しきい値がアクティブになるようにするには、少なくとも 3 日の期間と、30 個のメトリック サンプルが必要です。
メトリック グラフを使用している場合は、次のことを確認します。
解決されていない同じ条件を監視するアラートが既にあるのに、アラートが生成される場合は、自動的にアラートを解決しないようにアラート ルールが構成されているかどうかを確認します。 つまり、警告ルールがステートレスになり、発生した警告が警告ルールによって自動解決されず、同じ時系列で警告を再度生成する前に、発生した警告が解決されることが要求されません。 自動解決しないようにアラート ルールが構成されているかどうかを確認するには、次のようにします。
autoMitigate
プロパティが false
に設定されているかどうかを確認します。動的しきい値を使用するアラート ルールが発動しすぎて邪魔になるなら、場合によっては、動的しきい値アラート ルールの感度を下げる必要があります。 次のいずれかのオプションを使用します。
メトリック値で大きな変動が示されている場合、動的しきい値によって作成されるメトリック値を中心としたモデルが大きくなり、その結果として境界が予想よりも低くなったり高くなったりする可能性があります。 このシナリオは次の場合に発生することがあります。
感度が低く設定されている。
メトリックで、変動幅が大きい不規則な動作が示されている (データにスパイクやディップとして示されている)。
より高い感度を選択するか、[遡って確認する期間] でより大きな値を選択して、モデルの感度を低くすることを検討してください。 [次よりも前のデータを無視します] オプションを使って、モデルを作成するために使用される履歴データから最近の不規則性を除外することもできます。
特定のメトリックに対してアラートを生成したいが、アラート ルールの作成時に表示できない場合は、次のことを確認してください。
メモリやディスク領域など、仮想マシンのゲスト オペレーティング システム メトリックについてアラートを作成するには、このデータを Azure Monitor メトリックに収集するために必要なエージェントがインストールされていることを確めます。
仮想マシンのゲスト オペレーティング システムからデータを収集する方法の詳細については、「Azure Virtual Machines を監視する」を参照してください。
注意
Log Analytics ワークスペースに送信されるようにゲスト メトリックを構成した場合、これらのメトリックは Log Analytics ワークスペース リソースの下に表示され、それらを監視するアラート ルールを作成した後でデータ ''のみ'' の表示が開始されます。 これを行うには、ログのメトリック アラートを構成する手順に従います。
現在、1 つのアラート ルールを使用して複数の仮想マシンのゲスト メトリックを監視することは、メトリック アラートではサポートされていません。 しかし、ログ アラート ルールを使用できます。 これを行うには、ゲスト メトリックが Log Analytics ワークスペースに収集されていることを確認し、ワークスペースでログ アラート ルールを作成します。
メトリックの特定のディメンション値に対してアラートを生成したいが、これらの値が見つからない場合:
メトリック アラート ルールを作成する場合、メトリック名は Metric Definitions API に対して検証され、それが存在することが確認されます。 場合によっては、カスタム メトリックに対して、それが生成される前にアラート ルールを作成する必要があります。 たとえば、Resource Manager テンプレートを使用して、カスタム メトリックを生成する Application Insights リソースをそのメトリックを監視するアラート ルールと共に作成する場合です。
カスタム メトリックの定義を検証しようとしたときにデプロイ エラーが発生しないようにするには、アラート ルールの criteria
セクションで skipMetricValidation
パラメーターを使用します。 このパラメーターを使用すると、メトリックの検証はスキップされます。 Resource Manager テンプレートでこのパラメーターを使用する方法については、次の例を参照してください。 詳細については、メトリック警告ルールを作成するための Resource Manager テンプレートの完全なサンプルに関する記事を参照してください。
"criteria": {
"odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
"allOf": [
{
"name" : "condition1",
"metricName": "myCustomMetric",
"metricNamespace": "myCustomMetricNamespace",
"dimensions":[],
"operator": "GreaterThan",
"threshold" : 10,
"timeAggregation": "Average",
"skipMetricValidation": true
}
]
}
注意
数日間出力されていない既存のカスタム メトリックでアラート ルールを定義するときは、skipMetricValidation
パラメーターも使用する必要がある場合があります。
動的しきい値は、ほとんどのメトリックでサポートされていますが、すべてではありません。 メトリックのリストについては、「動的しきい値でサポートされていないメトリック」を参照してください。
「Azure Monitor のサポートされるメトリック」のメトリックの説明を確認して、リソースの特定のバージョンまたはエディションでのみ使用できるかどうか、またはこの特定の種類で使用できるかどうかを確認してください。
たとえば、SQLデータベースリソースまたはストレージファイルサービスでは、特定のバージョンのリソースでのみサポートされる特定のメトリックがあります。
このエラーは、アラート ルールのスコープに問題があることを示しています。 これは、複数リソース構成をサポートするリソースの種類 (仮想マシンや SQL データベースなど) をスコープとするアラート ルールを編集し、同じ種類の別のリソースを別のリージョンから追加しようとすると発生する可能性があります。 リージョンが異なる同じ種類の複数のリソースに対するアラートは、メトリック アラートではサポートされません。
許可されるサブスクリプションあたりのメトリック警告ルール数は、サービス制限の対象になります。
使用中のメトリック警告ルールの数の確認に関するページを参照して、現在使用中のメトリック警告ルールの数を確認します。
サービス制限に達した場合は、次の手順が問題の解決に役立つ場合があります。
警告と通知に関する一般的なトラブルシューティング情報については、「Azure Monitor のアラートの問題のトラブルシューティング」を参照してください。
トレーニング
モジュール
Azure Monitor アラートを使用したインシデント対応の向上 - Training
Azure Monitor アラートを使用して、インフラストラクチャ内のインシデントとアクティビティに対応します。
ドキュメント
Azure Monitor の警告の概要 - Azure Monitor
Azure Monitor アラート、アラート ルール、アクション処理ルール、アクション グループ、およびそれらが連携してシステムを監視する方法について説明します。
1 つのメトリック アラート ルールで複数の時系列を監視する - Azure Monitor
複数の時系列に対して 1 つのアラート ルールを使用して大規模にアラートを発生させます。
Azure Monitor のアラートと通知のトラブルシューティング - Azure Monitor
Azure Monitor のアラートに関する一般的な問題のトラブルシューティングと考えられる解決策。