クイック スタート: Web ポータルを使用して初めてのメトリックを監視する

Azure Metrics Advisor のインスタンスをプロビジョニングするとき、サービスの操作には、API と Web ベースのワークスペースを使用できます。 Web ベースのワークスペースは使いやすく、サービスをすぐに利用することができます。 また、設定の構成、モデルのカスタマイズ、根本原因分析の実行のための視覚的な手段も用意されています。

前提条件

ヒント

  • Metrics Advisor リソースのデプロイには 10 分から 30 分ほどかかる場合があります。 正常にデプロイされたら、 [リソースに移動] を選択します。
  • REST API を使用してサービスを対話的に操作する場合は、作成したリソースのキーとエンドポイントが必要です。 それらは、作成したリソースの [キーとエンドポイント] タブで確認できます。

このドキュメントでは、初めてのモニターを作成する例として SQL データベースを使用します。

ワークスペースにサインインする

リソースが作成されたら、ご自分の Active Directory アカウントで Metrics Advisor ポータルにサインインします。 ランディング ページから、ディレクトリサブスクリプション、作成した ワークスペース を選択して、 [Get started](開始する) を選択します。 時系列データを使用するには、左側のメニューから [Add data feed](データ フィードの追加) を選択します。

現在、使用可能なリージョンごとに 1 つの Metrics Advisor リソースを作成できます。 Metrics Advisor ポータルでは、いつでもワークスペースを切り替えることができます。

時系列データ

Metrics Advisor には、Azure SQL Database、Azure Data Explorer、Azure Table Storage など、さまざまなデータ ソース用のコネクタが用意されています。 データを接続する手順は、コネクタが異なっていても似ています。ただし、いくつかの構成パラメーターが異なる可能性があります。 詳細については、データ ソースの接続に関するページを参照してください。

このクイックスタートは、例として SQL データベースを使用します。 同じ手順に従って独自のデータを取り込むこともできます。

データ スキーマの要件と構成

Azure Metrics Advisor は、時系列の異常検出、診断、分析のためのサービスです。 AI を利用したサービスとして、ユーザーのデータを使用して、使用するモデルをトレーニングします。 このサービスは、次の列を含んだ集計データのテーブルを受け取ります。

  • Measure (必須): メジャーは、単位固有の基本的な用語であり、メトリックの定量化可能な値です。 数値を格納する 1 つまたは複数の列を意味します。
  • Timestamp (省略可): 型が DateTime または String である、0 個または 1 個の列。 この列が設定されなかった場合は、タイムスタンプが各インジェスト期間の開始時刻として設定されます。 タイムスタンプを yyyy-MM-ddTHH:mm:ssZ の形式で指定します。
  • Dimension (省略可): ディメンションは、1 つまたは複数のカテゴリの値です。 これらの値を組み合わせることによって、特定の一変量時系列 (国、言語、テナントなど) が識別されます。 ディメンション列のデータ型は任意です。 大量の列と値を扱う際は、処理の対象となるディメンションの数が多くなりすぎないように注意してください。

Azure Data Lake Storage や Azure Blob Storage などのデータ ソースを使用している場合は、予期されるメトリック スキーマに合わせてデータを集計できます。 これは、これらのデータ ソースがメトリック入力としてファイルを使用するためです。

Azure SQL や Azure Data Explorer などのデータ ソースを使用している場合は、集計関数を使用して、予期されるスキーマにデータを集計できます。 これは、これらのデータ ソースで、ソースからメトリック データを取得するためのクエリの実行がサポートされているためです。

接続設定とクエリを構成する

目的の時系列データ ソースに接続してデータ フィードを追加します。 最初に次のパラメーターを選択します。

  • [Source Type](ソースの種類) : 時系列データを格納するデータ ソースの種類。
  • [Granularity](細分性) : 時系列データ内の連続するデータ ポイントの間隔 (年単位、月単位、日単位など)。 サポートされている最短の間隔は 60 秒です。
  • [Ingest data since (UTC)](データの取り込みの開始 (UTC)) : 取り込む対象の最初のタイムスタンプの開始時刻。

接続設定を示すスクリーンショット。

データの読み込み

接続とクエリの文字列を入力したら、 [データの読み込み] を選択します。 Metrics Advisor によって、データを読み込むための接続とアクセス許可が確認され、クエリで使用される必要なパラメーターが確認され、データ ソースの列名がチェックされます。

この手順でエラーが発生した場合:

  1. 接続文字列が有効かどうかを確認します。
  2. 十分なアクセス許可があり、インジェスト ワーカーの IP アドレスにアクセス権が付与されていることを確認します。
  3. 必要なパラメーター (@IntervalStart@IntervalEnd) がクエリで使用されているかどうかを確認します。

スキーマの構成

クエリを実行してデータが読み込まれたら、適切なフィールドを選択します。

[選択] 説明 メモ
Timestamp データ ポイントのタイムスタンプ。 タイムスタンプが省略されている場合、Metrics Advisor では、代わりにデータ ポイントが取り込まれた時点のタイムスタンプが使用されます。 データ フィードごとに、最大 1 列をタイムスタンプとして指定できます。 省略可能。 指定できるのは最大 1 列です。
測定値 データ フィード内の数値。 データ フィードごとに、複数のメジャーを指定できますが、少なくとも 1 列をメジャーとして選択する必要があります。 少なくとも 1 列を指定する必要があります。
ディメンション カテゴリ値。 異なる値を組み合わせることで、特定の単一ディメンションの時系列が識別されます。 例として、国、言語、テナントなどがあります。 0 個以上の任意の数の列をディメンションとして選択できます。 文字列以外の列をディメンションとして選択する場合は、ディメンションのエクスプロージョンに注意が必要です。 省略可能。
無視 選択した列を無視します。 省略可能。 クエリを使用してデータを取得することをサポートしているデータ ソースの場合、[無視] オプションはありません。

スキーマ構成を示すスクリーンショット。

スキーマを構成したら、 [Verify schema](スキーマの確認) を選択します。 Metrics Advisor によって、次のチェックが実行されます。

  • クエリ対象のデータのタイムスタンプが 1 つの間隔に収まっているかどうか。
  • 1 つのメトリック間隔内で、ディメンションの組み合わせが同じ重複した値が返されているかどうか。

自動ロールアップ設定

重要

根本原因分析およびその他の診断機能を有効にする場合は、自動ロールアップ設定を構成します。 分析を有効にした後に自動ロールアップ設定を変更することはできません。

Metrics Advisor を使用すると、インジェスト中に各ディメンションに対して自動的に集計を実行できます。 その後、このサービスによって、根本原因分析やその他の診断機能で使用できる階層が構築されます。 詳細については、「自動ロール アップ設定」を参照してください。

データ フィードのカスタム名を指定します。これは、ワークスペースに表示されます。 [送信] を選択します。

検出構成を調整する

データ フィードが追加されると、Metrics Advisor によって、指定された開始日からメトリック データの取り込みが試行されます。 データが完全に取り込まれるまでには、しばらく時間がかかります。インジェストの状況は、データ フィード ページの上部にある [Ingestion progress](インジェスト進行状況) を選択して確認できます。 データが取り込まれた場合、Metrics Advisor は検出を適用し、引き続きソースの新しいデータを監視します。

検出が適用されたら、データ フィードに一覧表示されるいずれかのメトリックを選択して メトリックの詳細ページ を探します。 ここでは、次のことを行うことができます。

  • このメトリック下にあるすべての時系列スライスの視覚化を表示する。
  • 必要な結果が得られるように検出構成を更新する。
  • 異常が検出された場合の通知を設定する。

メトリックの詳細を示すスクリーンショット。

診断の分析情報を表示する

検出構成を調整すると、検出された異常がデータ内の実際の異常を反映していることがわかります。 Metrics Advisor では、根本原因を特定するために、特定のディメンションに対して多次元メトリックの分析が実行されます。 また、メトリック グラフ機能を使用して、クロスメトリック分析も実行されます。

診断の分析情報を表示するには、時系列の視覚化に表示される赤色のドットを選択します。 これらの赤色のドットは、検出された異常を表します。 ウィンドウが開いて、インシデント分析ページへのリンクが表示されます。

インシデントのリンクを示すスクリーンショット。

[インシデント分析] ページには、関連する異常と診断分析情報のグループが表示されます。 以降のセクションでは、インシデントを診断するための主要な手順について説明します。

現在のインシデントの概要を確認する

概要は、このインシデント分析ページの上部にあります。 この概要には、基本情報、アクションとトレース、および分析された根本原因が含まれています。 基本情報には、影響を受ける上位の系列と図、影響の開始および終了時刻、重大度、含まれる異常の総数が含まれています。

分析された根本原因は、自動的に分析された結果です。 Metrics Advisor により、同じタイムスタンプでディメンション値が異なり、1 つのメトリック内に含まれ、時系列でキャプチャされたすべての異常が分析されます。 次に、サービスにより、関連付けが実行され、グループに関する異常がまとめてクラスタリングされ、根本原因についてのアドバイスが生成されます。

インシデント診断の概要を示すスクリーンショット。

これらに基づいて、現在の異常状態、そのインシデントの影響、最も可能性の高い根本原因を簡単に、いち早く把握することができます。 そして、直ちに対処してインシデントを解決できます。

クロスディメンション診断の分析情報を表示する

また、診断ツリー機能を使用して、同じメトリック内の他のディメンションの異常な状態について、包括的な方法で詳細情報を取得することもできます。

複数のディメンションを持つメトリックの場合、Metrics Advisor により、時系列が診断ツリーと呼ばれる階層に分類されます。 たとえば、revenue メトリックは、region と category という 2 つのディメンションで監視されます。 SUM などの集計ディメンション値が必要です。 そこで、region = SUM および category = SUM の時系列は、そのツリー内のルート ノードとして分類されます。 SUM ディメンションで異常がキャプチャされた場合はいつでも、それを分析して、親ノードの異常に最も影響している特定のディメンション値を突き止めることができます。 各ノードを選択して展開し、詳細情報を表示します。

インシデント診断のクロスディメンション ビューを示すスクリーンショット。

クロスメトリック診断の分析情報を表示する

1 つのメトリックの異常状態を確認するだけでは問題を分析することが難しく、場合によっては複数のメトリックを関連付けて分析する必要があります。 これを行うには、メトリック間のリレーションシップを示すメトリック グラフを構成します。

前のセクションで説明したクロスディメンション診断の結果を使用することで、根本原因が特定のディメンション値に限定されていることを特定できます。 次に、メトリック グラフを使用して分析された根本原因のディメンションでフィルター処理し、他のメトリックの異常状態を確認します。

インシデント診断のクロスメトリック分析を示すスクリーンショット。

追加の機能を使用して、より多くの診断分析情報をピボットすることもできます。 これらの機能を使用すると、異常なディメンションのドリルダウン、類似した異常の表示、メトリック間の比較を行うことができます。 詳細については、インシデントの診断に関するページを参照してください。

新しい異常が見つかったときに通知を受け取る

データに異常が検出されたときに通知を受け取る場合、1 つまたは複数のメトリックに関するサブスクリプションを作成することができます。 Metrics Advisor は、フックを使用してアラートを送信します。 email hook、Web hook、Azure DevOps の 3 種類のフックがサポートされています。 ここでは例として Web hook を使用します。

Web hook を作成する

Metrics Advisor では、Web hook を使用して、プログラムで異常を表面化させることができます。 このサービスでは、アラートがトリガーされたときにユーザーが指定した API が呼び出されます。 詳細については、「フックを作成する」を参照してください。

アラート設定の構成

フックの作成後、どのアラート通知がどのように送信されるかは、アラートの設定によって決まります。 アラートの設定は、メトリックごとに複数用意することができます。 重要な設定は 2 つあります。1 つは、対象となる異常を指定する [Alert for](アラート対象) で、もう 1 つは、アラートに含める異常を定義する [Filter anomaly options](異常のフィルター処理オプション) です。 詳しくは、「アラート設定の追加または編集」を参照してください。

次のステップ