Insights を使用して単一の Azure Stack HCI バージョン 23H2 クラスターを監視する

[アーティクル]
04/22/2024

適用対象: Azure Stack HCI バージョン 23H2

この記事では、Insights を使用して 1 つの Azure Stack HCI クラスターを監視する方法について説明します。複数の Azure Stack HCI クラスターについては、「 Insights を使用して複数の Azure Stack HCI クラスターを監視する」を参照してください。

Insights は、Azure Stack HCI クラスターの監視をすぐに開始できる Azure Monitor の機能です。クラスター、サーバー、仮想マシン、ストレージに関する主要なメトリック、正常性、使用状況情報を表示できます。

少し時間を取って、Azure Stack HCI の分析情報に関するビデオチュートリアルをwatchします。

メリット

Azure Stack HCI の分析情報には、次の利点があります。

Azure によって管理されます。 Insights は Azure によって管理され、Azure portalを介してアクセスされ、常に最新の状態であることを確認します。データベースや特別なソフトウェアのセットアップは必要ありません。
スケーラビリティ。 Insights では、複数のサブスクリプション間で 400 を超えるクラスター情報セットを同時に読み込む機能があります。クラスター、ドメイン、または物理的な場所に制限はありません。
カスタマイズ性:個々のテナントに合わせてアプリケーションをさまざまな方法でカスタマイズできます。 Insight のエクスペリエンスは、Azure Monitor ブックテンプレートの上に構築されています。これにより、ビューとクエリを変更したり、特定の制限に合わせてしきい値を変更または設定したり、これらのカスタマイズをブックに保存したりできます。その後、ブック内のグラフを Azure ダッシュボードにピン留めできます。

前提条件

Insights for Azure Stack HCI を使用する前提条件を次に示します。

デプロイおよび登録されている Azure Stack HCI クラスターにアクセスできる必要があります。
Azure リソースのマネージド ID を有効にする必要があります。詳細については、「拡張管理を有効にする」を参照してください。

分析情報を有効にする

Insights を有効にすると、便利な正常性メトリックを提供することで、Log Analytics ワークスペースに現在関連付けられているすべての Azure Stack HCI クラスターを監視できます。 Insights は Azure Monitor エージェントをインストールし、Azure Stack HCI クラスターを監視するためのデータ収集規則 (DCR) を構成するのに役立ちます。

Azure portalから Insights を有効にするには、次の手順に従います。

Azure portalで、Azure Stack HCI クラスターリソースページを参照し、クラスターを選択します。 [機能] タブで、[分析情報] を選択します。
[ 分析情報 ] ページで、[ 作業の開始] を選択します。
[ Insights の構成 ] ページで、[ データ収集ルール ] ドロップダウンから既存の DCR を選択します。 DCR は、収集する必要があるイベントログとパフォーマンスカウンターを指定し、Log Analytics ワークスペースに格納します。 Insights では、既定の DCR がまだ存在しない場合に作成されます。 Insights に対して有効になっている DCR のみが含まれます。
(省略可能)[分析情報の構成] ページで [新規] Create選択して、新しい DCR を作成することもできます。

重要

独自の DCR を作成しないことを強くお勧めします。 Insights によって作成された DCR には、その操作に必要な特別なデータストリームが含まれています。この DCR を編集して、Windows イベントや Syslog イベントなど、より多くのデータを収集できます。 AMA インストールによって作成された DCR には、DCR 名が付いたプレフィックス AzureStackHCI- が付けられます。
1. [ 新しいデータ収集ルール ] ページで、サブスクリプション、DCR 名、およびデータ収集エンドポイント (DCE) 名を指定します。 DCEs は、Azure Monitor エージェントに関連付けられている DCR をフェッチするために構成サービスにアクセスするために使用されます。 DCE の詳細については、「 Azure Monitor のデータ収集エンドポイント」を参照してください。
  
  注意
  
  エージェントでプライベートリンクを使用している場合は、DCEs を追加する必要があります。 AMA ネットワーク設定の詳細については、「 Azure Monitor エージェントのネットワーク設定を定義する」を参照してください。
2. [確認および作成] ボタンを選択します。
  
  監視されていないクラスターに対して DCR がまだ作成されていない場合は、パフォーマンスカウンターが有効になり、Windows イベントログチャネルが有効になっている状態で作成されます。
DCR 名、イベントログの数、パフォーマンスカウンター、およびデータが格納されている Log Analytics ワークスペースの名前の概要を表示して、最後の画面を確認します。 [セットアップ] を選択します。

[ セットアップ] を選択すると、[ 拡張機能 ] ページにリダイレクトされ、エージェントのインストールの状態を確認できます。 Insights を構成すると、クラスターのすべてのノードに AMA が自動的にインストールされます。
Azure Stack HCI クラスターリソースページに移動し、クラスターを選択します。分析情報が [機能] タブに [構成済み] と表示されるようになりました。

データ収集ルール

Azure Monitor エージェントを使用してマシンで Insights を有効にする場合は、使用する DCR を指定する必要があります。 DCR の詳細については、「 Azure Monitor のデータ収集ルール」を参照してください。

オプション	説明
パフォーマンスカウンター	オペレーティングシステムから収集するデータパフォーマンスカウンターを指定します。このオプションは、すべてのコンピューターに必要です。これらのパフォーマンスカウンターは、Insights ブックの視覚エフェクトを設定するために使用されます。現在、Insights ブックでは、、`Network Interface()\Bytes Total/secProcessor(_Total)\% Processor TimeRDMA Activity()\RDMA Inbound Bytes/sec`およびの `Memory()\Available Bytes`5 つのパフォーマンスカウンターが使用されています`RDMA Activity()\RDMA Outbound Bytes/sec`
イベントログチャネル	オペレーティングシステムから収集する Windows イベントログを指定します。このオプションは、すべてのコンピューターに必要です。 Windows イベントログは、Insights ブックの視覚化を設定するために使用されます。現在、データは 2 つの Windows イベントログチャネルを介して収集されます。 `- microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational`
Log Analytics ワークスペース	データを格納するワークスペース。 Insights を持つワークスペースのみが一覧表示されます。

イベントチャネル

および Windows イベントチャネルは、Windows イベントログの下の Log Analytics ワークスペースに追加されます。Microsoft-windows-health/operationalMicrosoft-windows-sddc-management/operational

これらのログを収集することで、Insights は個々のサーバー、ドライブ、ボリューム、VM の正常性状態を表示します。既定では、5 つのパフォーマンスカウンターが追加されます。

パフォーマンスカウンター

既定では、次の 5 つのパフォーマンスカウンターが追加されます。

次の表では、監視するパフォーマンスカウンターについて説明します。

パフォーマンスカウンター	説明
Memory(*)\Available Bytes	Available Bytes は、プロセスへの割り当てまたはシステム使用にすぐに利用できる物理メモリの量 (バイト単位) です。
Network Interface(*)\Bytes Total/sec	各ネットワークアダプターが 1 秒あたりに送信および受信したバイト数。フレーム文字も含みます。 Bytes Total/sec は、Bytes Received/sec と Bytes Sent/sec の合計値です。
Processor(_Total)% Processor Time	すべてのプロセススレッドで命令を実行するためにプロセッサを使用した経過時間の割合。
RDMA Activity(*)\RDMA Inbound Bytes/sec	ネットワークアダプターが RDMA 経由で受信したデータの 1 秒あたりの転送速度。
RDMA Activity(*)\RDMA Outbound Bytes/sec	ネットワークアダプターが RDMA 経由で送信したデータの 1 秒あたりの転送速度。

Insights を有効にすると、データの収集に最大 15 分かかることがあります。プロセスが完了すると、左側のウィンドウの [分析情報 ] メニューからクラスターの正常性の豊富な視覚化を確認できます。

分析情報を無効にする

Insights を無効にするには、次の手順に従います。

[機能] タブで、[分析情報] を選択します。
[分析情報を無効にする] を選択します。

Insights 機能を無効にすると、データ収集ルールとクラスター間の関連付けが削除され、ヘルスサービスと SDDC 管理ログは収集されなくなります。ただし、既存のデータは削除されません。そのデータを削除する場合は、DCR と Log Analytics ワークスペースに移動し、データを手動で削除します。

Insights の更新

[分析情報] タイルには、次の場合に更新が必要なメッセージが表示されます。

データ収集ルールが変更されました。
Windows イベントログの正常性イベントが削除されます。
Log Analytics ワークスペースの 5 つのパフォーマンスカウンターのいずれかが削除されます。

Insights を再度有効にするには、次の手順に従います。

[機能] で [分析情報] タイルを選択します。
[更新] を選択して、視覚化をもう一度表示します。

トラブルシューティング

このセクションでは、Insights for Azure Stack HCI の使用に関する問題を解決するためのガイダンスを提供します。

データが設定されていない空白のブックページのトラブルシューティング

問題。 次のスクリーンショットに示すように、データが入力されていない空白の [ブック] ページが表示されます。

考えられる原因。 この問題には、Insights の最近の構成や、関連付けられている DCR の不適切な構成など、いくつかの原因が考えられます。

解決方法。 問題のトラブルシューティングを行うには、次の手順を順番に実行します。

最近 Insights を構成した場合は、AMA がデータを収集するまで最大 1 時間待ちます。
関連付けられている DCR の構成を確認します。「データ収集ルール」セクションで説明されているように、イベントチャネルとパフォーマンスカウンターが、関連付けられている DCR にデータソースとして追加されていることを確認します。
上記の手順を実行しても問題が解決しない場合でもデータが表示されない場合は、カスタマーサポートにお問い合わせください。

詳細なトラブルシューティングガイダンスについては、「 Azure Monitor エージェントのトラブルシューティングガイダンス」を参照してください。

分析情報の視覚化

分析情報を有効にすると、次の表に、すべてのリソースに関する詳細が示されます。

健康

クラスターの正常性エラーを提供します。

メトリック	説明	ユニット	例
障害	正常性エラーの簡単な説明。リンクをクリックすると、サイドパネルが開き、詳細が表示されます。	ユニットなし	PoolCapacityThresholdExceeded
障害が発生しているリソースの種類	エラーが発生したリソースの種類。	ユニットなし	StoragePool のフレンドリ名を
障害が発生しているリソース ID	正常性エラーが発生したリソースの一意の ID。	一意の ID	{1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
重大度	エラーの重大度は、警告またはクリティカルである可能性があります。	ユニットなし	警告
障害が最初に発生した時刻	サーバーの最終更新時のタイムスタンプ。	Datetime	2022/4/9、午後 12:15:42

Server (サーバー)

メトリック	説明	ユニット	例
サーバー	クラスター内のサーバーの名前。	ユニットなし	VM-1
最終更新日	サーバーが最後に更新された日時。	Datetime	2022/4/9、午後 12:15:42
Status	クラスター内のサーバーリソースの正常性。	正常、警告、クリティカル、またはその他があります	Healthy
CPU 使用率	プロセスが CPU を使用した時間の割合。	Percent	56%
メモリ使用量	サーバープロセスのメモリ使用量は、カウンター Process\Private Bytes にメモリマップデータのサイズを加えた値と同じです。	Percent	16%
論理プロセッサ	論理プロセッサ数	Count	2
CPU	CPU の数。	Count	2
稼働時間	マシン (特にコンピューター) が動作している時間。	Timespan	2.609 時間。
サイト	サーバーが属するサイトの名前。	サイト名	SiteA のノードでワークロードの動作を維持します。
ドメイン名	サーバーが属するローカルドメイン。	ユニットなし	Contoso.local

仮想マシン

クラスター内のすべての仮想マシンの状態を提供します。 VM の状態は、実行中、停止済み、失敗、またはその他 (不明、開始、スナップショット、保存、停止、一時停止、再開、一時停止、中断) のいずれかになります。

メトリック	説明	ユニット	例
サーバー	サーバーの名前。	ユニットなし	Sample-VM-1
最終更新日時	これにより、サーバーが最後に更新された日時が表示されます。	Datetime	2022/4/9、午後 12:24:02
[Total VMs] (VM の総数)	サーバーノード内の VM の数。	Count	0 /0 実行中
実行中	サーバーノードで実行されている VM の数。	Count	2
停止済み	サーバーノードで停止されている VM の数。	Count	3
失敗	サーバーノードで失敗している VM の数。	Count	2
その他	VM が次のいずれかの状態 (Unknown、Starting、Snapshotting、Saving、Stopping、Pausesing、Resuming、Paused、Suspended) の場合、"Other" と見なされます。	Count	2

Storage

次の表に、クラスター内のボリュームとドライブの正常性を示します。

メトリック	説明	ユニット	例
ボリューム	ボリュームの名前	ユニットなし	ClusterPerformanceHistory
最終更新日	ストレージが最後に更新された日時。	Datetime	2022/4/14、午後 2:58:55
Status	ボリュームの状態。	正常、警告、クリティカル、またはその他。	Healthy
合計容量	レポート期間中のデバイスの合計容量 (バイト単位)。	バイト	2.5 GB
使用可能な容量	レポート期間中の使用可能な容量 (バイト単位)。	バイト	20B
IOPS	1 秒あたりの入出力処理。	1 秒あたり	45/s
スループット	Application Gateway で処理された 1 秒あたりのバイト数。	バイト/秒	5B/s
Latency	I/O 要求の完了にかかる時間。	Second	0.0016 s
回復性	失敗から復旧する容量。データの可用性を最大化します。	ユニットなし	3 方向ミラー
重複除去	ディスクに格納する必要があるデータの物理バイト数を減らすプロセス。	使用可能か否か	はい/いいえ
ファイルシステム	ファイルシステムの型。	ユニットなし	ReFS

Azure Monitor の価格

監視の視覚化を有効にすると、ログは次の場所から収集されます。

正常性管理 (Microsoft-windows-health/operational)。
SDDC 管理 (Microsoft-Windows-SDDC-Management/Operational; イベント ID: 3000、3001、3002、3003、3004)。

取り込まれたデータの量と Log Analytics ワークスペースのデータ保持設定に基づいて課金されます。

Azure Monitor は従量課金制であり、課金アカウントごとに毎月最初の 5 GB は無料です。価格は、使用している Azure のリージョンなど、複数の要因によって異なるため、最新の価格計算については、Azure Monitor 価格計算ツールを使用してください。

次の方法で共有

Insights を使用して単一の Azure Stack HCI バージョン 23H2 クラスターを監視する

メリット

前提条件