次の方法で共有


Insights を使用して単一の Azure Stack HCI バージョン 23H2 クラスターを監視する

適用対象: Azure Stack HCI バージョン 23H2

この記事では、Insights を使用して 1 つの Azure Stack HCI クラスターを監視する方法について説明します。 複数の Azure Stack HCI クラスターについては、「 Insights を使用して複数の Azure Stack HCI クラスターを監視する」を参照してください。

Insights は、Azure Stack HCI クラスターの監視をすぐに開始できる Azure Monitor の機能です。 クラスター、サーバー、仮想マシン、ストレージに関する主要なメトリック、正常性、使用状況情報を表示できます。

少し時間を取って、Azure Stack HCI の分析情報に関するビデオ チュートリアルをwatchします。

メリット

Azure Stack HCI の分析情報には、次の利点があります。

  • Azure によって管理されます。 Insights は Azure によって管理され、Azure portalを介してアクセスされ、常に最新の状態であることを確認します。 データベースや特別なソフトウェアのセットアップは必要ありません。

  • スケーラビリティ。 Insights では、複数のサブスクリプション間で 400 を超えるクラスター情報セットを同時に読み込む機能があります。 クラスター、ドメイン、または物理的な場所に制限はありません。

  • カスタマイズ性:個々のテナントに合わせてアプリケーションをさまざまな方法でカスタマイズできます。 Insight のエクスペリエンスは、Azure Monitor ブック テンプレートの上に構築されています。 これにより、ビューとクエリを変更したり、特定の制限に合わせてしきい値を変更または設定したり、これらのカスタマイズをブックに保存したりできます。 その後、ブック内のグラフを Azure ダッシュボードにピン留めできます。

前提条件

Insights for Azure Stack HCI を使用する前提条件を次に示します。

  • デプロイおよび登録されている Azure Stack HCI クラスターにアクセスできる必要があります。

  • Azure リソースのマネージド ID を有効にする必要があります。 詳細については、「 拡張管理を有効にする」を参照してください。

分析情報を有効にする

Insights を有効にすると、便利な正常性メトリックを提供することで、Log Analytics ワークスペースに現在関連付けられているすべての Azure Stack HCI クラスターを監視できます。 Insights は Azure Monitor エージェントをインストールし、Azure Stack HCI クラスターを監視するための データ収集規則 (DCR) を 構成するのに役立ちます。

Azure portalから Insights を有効にするには、次の手順に従います。

  1. Azure portalで、Azure Stack HCI クラスター リソース ページを参照し、クラスターを選択します。 [機能] タブで、[分析情報] を選択します。

    Insights タイルを示すスクリーンショット。

  2. [ 分析情報 ] ページで、[ 作業の開始] を選択します。

    [作業の開始] ボタンを示すスクリーンショット。

  3. [ Insights の構成 ] ページで、[ データ収集ルール ] ドロップダウンから既存の DCR を選択します。 DCR は、収集する必要があるイベント ログとパフォーマンス カウンターを指定し、Log Analytics ワークスペースに格納します。 Insights では、既定の DCR がまだ存在しない場合に作成されます。 Insights に対して有効になっている DCR のみが含まれます。

    Insights 構成ウィンドウを示すスクリーンショット。

  4. (省略可能)[分析情報の構成] ページで [新規] Create選択して、新しい DCR を作成することもできます。

    重要

    独自の DCR を作成しないことを強くお勧めします。 Insights によって作成された DCR には、その操作に必要な特別なデータ ストリームが含まれています。 この DCR を編集して、Windows イベントや Syslog イベントなど、より多くのデータを収集できます。 AMA インストールによって作成された DCR には、DCR 名が付いたプレフィックス AzureStackHCI- が付けられます。

    1. [ 新しいデータ収集ルール ] ページで、サブスクリプション、DCR 名、およびデータ収集エンドポイント (DCE) 名を指定します。 DCEs は、Azure Monitor エージェントに関連付けられている DCR をフェッチするために構成サービスにアクセスするために使用されます。 DCE の詳細については、「 Azure Monitor のデータ収集エンドポイント」を参照してください。

      注意

      エージェントでプライベート リンクを使用している場合は、DCEs を追加する必要があります。 AMA ネットワーク設定の詳細については、「 Azure Monitor エージェントのネットワーク設定を定義する」を参照してください。

      [データ収集ルール] ウィンドウを示すスクリーンショット。

    2. [確認および作成] ボタンを選択します。

      監視されていないクラスターに対して DCR がまだ作成されていない場合は、パフォーマンス カウンターが有効になり、Windows イベント ログ チャネルが有効になっている状態で作成されます。

  5. DCR 名、イベント ログの数、パフォーマンス カウンター、およびデータが格納されている Log Analytics ワークスペースの名前の概要を表示して、最後の画面を確認します。 [セットアップ] を選択します。

    データ収集ルールのドロップダウン セレクターを示すスクリーンショット。

    [ セットアップ] を選択すると、[ 拡張機能 ] ページにリダイレクトされ、エージェントのインストールの状態を確認できます。 Insights を構成すると、クラスターのすべてのノードに AMA が自動的にインストールされます。

  6. Azure Stack HCI クラスター リソース ページに移動し、クラスターを選択します。 分析情報が [機能] タブに [構成済み] と表示されるようになりました。

    [Insights] タイルが [構成済み] であることを示すスクリーンショット。

データ収集ルール

Azure Monitor エージェントを使用してマシンで Insights を有効にする場合は、使用する DCR を指定する必要があります。 DCR の詳細については、「 Azure Monitor のデータ収集ルール」を参照してください。

オプション 説明
パフォーマンス カウンター オペレーティング システムから収集するデータ パフォーマンス カウンターを指定します。 このオプションは、すべてのコンピューターに必要です。 これらのパフォーマンス カウンターは、Insights ブックの視覚エフェクトを設定するために使用されます。 現在、Insights ブックでは、、Network Interface()\Bytes Total/secProcessor(_Total)\% Processor TimeRDMA Activity()\RDMA Inbound Bytes/secおよび の Memory()\Available Bytes5 つのパフォーマンス カウンターが使用されていますRDMA Activity()\RDMA Outbound Bytes/sec
イベント ログ チャネル オペレーティング システムから収集する Windows イベント ログを指定します。 このオプションは、すべてのコンピューターに必要です。 Windows イベント ログは、Insights ブックの視覚化を設定するために使用されます。 現在、データは 2 つの Windows イベント ログ チャネルを介して収集されます。 - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Log Analytics ワークスペース データを格納するワークスペース。 Insights を持つワークスペースのみが一覧表示されます。

イベント チャネル

および Windows イベント チャネルは、Windows イベント ログの下の Log Analytics ワークスペースに追加されます。Microsoft-windows-health/operationalMicrosoft-windows-sddc-management/operational

[データ ソースの追加] ウィンドウを示すスクリーンショット。

これらのログを収集することで、Insights は個々のサーバー、ドライブ、ボリューム、VM の正常性状態を表示します。 既定では、5 つのパフォーマンス カウンターが追加されます。

パフォーマンス カウンター

既定では、次の 5 つのパフォーマンス カウンターが追加されます。

追加されたパフォーマンス カウンターを示すスクリーンショット。

次の表では、監視するパフォーマンス カウンターについて説明します。

パフォーマンス カウンター 説明
Memory(*)\Available Bytes Available Bytes は、プロセスへの割り当てまたはシステム使用にすぐに利用できる物理メモリの量 (バイト単位) です。
Network Interface(*)\Bytes Total/sec 各ネットワーク アダプターが 1 秒あたりに送信および受信したバイト数。フレーム文字も含みます。 Bytes Total/sec は、Bytes Received/sec と Bytes Sent/sec の合計値です。
Processor(_Total)% Processor Time すべてのプロセス スレッドで命令を実行するためにプロセッサを使用した経過時間の割合。
RDMA Activity(*)\RDMA Inbound Bytes/sec ネットワーク アダプターが RDMA 経由で受信したデータの 1 秒あたりの転送速度。
RDMA Activity(*)\RDMA Outbound Bytes/sec ネットワーク アダプターが RDMA 経由で送信したデータの 1 秒あたりの転送速度。

Insights を有効にすると、データの収集に最大 15 分かかることがあります。 プロセスが完了すると、左側のウィンドウの [分析情報 ] メニューからクラスターの正常性の豊富な視覚化を確認できます。

分析情報の視覚化を示すスクリーンショット。

分析情報を無効にする

Insights を無効にするには、次の手順に従います。

  1. [機能] タブで、[分析情報] を選択します。

  2. [分析情報を無効にする] を選択します。

    [分析情報の無効化] ウィンドウを示すスクリーンショット。

Insights 機能を無効にすると、データ収集ルールとクラスター間の関連付けが削除され、ヘルス サービスと SDDC 管理ログは収集されなくなります。ただし、既存のデータは削除されません。 そのデータを削除する場合は、DCR と Log Analytics ワークスペースに移動し、データを手動で削除します。

Insights の更新

[分析情報] タイルには、次の場合に更新が必要なメッセージが表示されます。

  • データ収集ルールが変更されました。
  • Windows イベント ログの正常性イベントが削除されます。
  • Log Analytics ワークスペースの 5 つのパフォーマンス カウンターのいずれかが削除されます。

Insights を再度有効にするには、次の手順に従います。

  1. [機能] で [分析情報] タイルを選択します。

  2. [更新] を選択して、視覚化をもう一度表示します。

    Update Insights ウィンドウを示すスクリーンショット。

トラブルシューティング

このセクションでは、Insights for Azure Stack HCI の使用に関する問題を解決するためのガイダンスを提供します。

データが設定されていない空白のブック ページのトラブルシューティング

問題。 次のスクリーンショットに示すように、データが入力されていない空白の [ブック] ページが表示されます。

空白の [ブック] ページのスクリーンショット。

考えられる原因。 この問題には、Insights の最近の構成や、関連付けられている DCR の不適切な構成など、いくつかの原因が考えられます。

解決方法。 問題のトラブルシューティングを行うには、次の手順を順番に実行します。

  1. 最近 Insights を構成した場合は、AMA がデータを収集するまで最大 1 時間待ちます。
  2. 関連付けられている DCR の構成を確認します。 「 データ収集ルール 」セクションで説明されているように、イベント チャネルとパフォーマンス カウンターが、関連付けられている DCR にデータ ソースとして追加されていることを確認します。
  3. 上記の手順を実行しても問題が解決しない場合でもデータが表示されない場合は、カスタマー サポートにお問い合わせください。

詳細なトラブルシューティング ガイダンスについては、「 Azure Monitor エージェントのトラブルシューティング ガイダンス」を参照してください。

分析情報の視覚化

分析情報を有効にすると、次の表に、すべてのリソースに関する詳細が示されます。

健康

クラスターの正常性エラーを提供します。

メトリック 説明 ユニット
障害 正常性エラーの簡単な説明。 リンクをクリックすると、サイド パネルが開き、詳細が表示されます。 ユニットなし PoolCapacityThresholdExceeded
障害が発生しているリソースの種類 エラーが発生したリソースの種類。 ユニットなし StoragePool のフレンドリ名を
障害が発生しているリソース ID 正常性エラーが発生したリソースの一意の ID。 一意の ID {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
重大度 エラーの重大度は、警告またはクリティカルである可能性があります。 ユニットなし 警告
障害が最初に発生した時刻 サーバーの最終更新時のタイムスタンプ。 Datetime 2022/4/9、午後 12:15:42

Server (サーバー)

メトリック 説明 ユニット
サーバー クラスター内のサーバーの名前。 ユニットなし VM-1
最終更新日 サーバーが最後に更新された日時。 Datetime 2022/4/9、午後 12:15:42
Status クラスター内のサーバー リソースの正常性。 正常、警告、クリティカル、またはその他があります Healthy
CPU 使用率 プロセスが CPU を使用した時間の割合。 Percent 56%
メモリ使用量 サーバー プロセスのメモリ使用量は、カウンター Process\Private Bytes にメモリ マップデータのサイズを加えた値と同じです。 Percent 16%
論理プロセッサ 論理プロセッサ数 Count 2
CPU CPU の数。 Count 2
稼働時間 マシン (特にコンピューター) が動作している時間。 Timespan 2.609 時間。
サイト サーバーが属するサイトの名前。 サイト名 SiteA のノードでワークロードの動作を維持します。
ドメイン名 サーバーが属するローカル ドメイン。 ユニットなし Contoso.local

仮想マシン

クラスター内のすべての仮想マシンの状態を提供します。 VM の状態は、実行中、停止済み、失敗、またはその他 (不明、開始、スナップショット、保存、停止、一時停止、再開、一時停止、中断) のいずれかになります。

メトリック 説明 ユニット
サーバー サーバーの名前。 ユニットなし Sample-VM-1
最終更新日時 これにより、サーバーが最後に更新された日時が表示されます。 Datetime 2022/4/9、午後 12:24:02
[Total VMs] (VM の総数) サーバー ノード内の VM の数。 Count 0 /0 実行中
実行中 サーバー ノードで実行されている VM の数。 Count 2
停止済み サーバー ノードで停止されている VM の数。 Count 3
失敗 サーバー ノードで失敗している VM の数。 Count 2
その他 VM が次のいずれかの状態 (Unknown、Starting、Snapshotting、Saving、Stopping、Pausesing、Resuming、Paused、Suspended) の場合、"Other" と見なされます。 Count 2

Storage

次の表に、クラスター内のボリュームとドライブの正常性を示します。

メトリック 説明 ユニット
ボリューム ボリュームの名前 ユニットなし ClusterPerformanceHistory
最終更新日 ストレージが最後に更新された日時。 Datetime 2022/4/14、午後 2:58:55
Status ボリュームの状態。 正常、警告、クリティカル、またはその他。 Healthy
合計容量 レポート期間中のデバイスの合計容量 (バイト単位)。 バイト 2.5 GB
使用可能な容量 レポート期間中の使用可能な容量 (バイト単位)。 バイト 20B
IOPS 1 秒あたりの入出力処理。 1 秒あたり 45/s
スループット Application Gateway で処理された 1 秒あたりのバイト数。 バイト/秒 5B/s
Latency I/O 要求の完了にかかる時間。 Second 0.0016 s
回復性 失敗から復旧する容量。 データの可用性を最大化します。 ユニットなし 3 方向ミラー
重複除去 ディスクに格納する必要があるデータの物理バイト数を減らすプロセス。 使用可能か否か はい/いいえ
ファイル システム ファイルシステムの型。 ユニットなし ReFS

Azure Monitor の価格

監視の視覚化を有効にすると、ログは次の場所から収集されます。

  • 正常性管理 (Microsoft-windows-health/operational)。
  • SDDC 管理 (Microsoft-Windows-SDDC-Management/Operational; イベント ID: 3000、3001、3002、3003、3004)。

取り込まれたデータの量と Log Analytics ワークスペースのデータ保持設定に基づいて課金されます。

Azure Monitor は従量課金制であり、課金アカウントごとに毎月最初の 5 GB は無料です。 価格は、使用している Azure のリージョンなど、複数の要因によって異なるため、最新の価格計算については、Azure Monitor 価格計算ツールを使用してください。

次の手順