使用 Insights 監視單一 Azure Stack HCI 版本 23H2 叢集

適用於:Azure Stack HCI 版本 23H2

本文說明如何使用 Insights 來監視單一 Azure Stack HCI 叢集。 如需多個 Azure Stack HCI 叢集,請參閱 使用 Insights 監視多個 Azure Stack HCI 叢集

深入解析是 Azure 監視器的一項功能,可讓您快速開始監視 Azure Stack HCI 叢集。 您可以檢視有關叢集、伺服器、虛擬機和記憶體的重要計量、健康情況和使用方式資訊。

請花一些時間 watch Azure Stack HCI 深入解析的影片逐步解說:

優點

Azure Stack HCI 的深入解析提供下列優點:

  • 由 Azure 管理。 深入解析是由 Azure 管理,並透過 Azure 入口網站 存取,確保一律是最新的。 不需要進行資料庫或特殊軟體設定。

  • 延展性。 深入解析能夠同時跨多個訂用帳戶載入超過 400 個叢集資訊集。 叢集、網域或實體位置沒有任何限制。

  • 自訂能力。 深入解析的體驗是以 Azure 監視器活頁簿範本為基礎所建置。 這可讓您變更檢視和查詢、修改或設定符合您特定限制的臨界值,然後將這些自定義專案儲存到活頁簿中。 然後,您可以將活頁簿中的圖表釘選到 Azure 儀錶板。

必要條件

以下是使用 Azure Stack HCI 深入解析的必要條件:

  • 您必須能夠存取已部署和註冊的 Azure Stack HCI 叢集。

  • 必須啟用 Azure 資源的受控識別。 如需詳細資訊,請參閱 啟用增強式管理

啟用深入解析

啟用深入解析藉由提供實用的健康情況計量,協助您監視目前與 Log Analytics 工作區相關聯的所有 Azure Stack HCI 叢集。 Insights 會安裝 Azure 監視器代理程式,並協助您設定數據收集 規則 (DCR) 監視 Azure Stack HCI 叢集。

請遵循下列步驟,從 Azure 入口網站 啟用 Insights:

  1. 在 Azure 入口網站 中,流覽至您的 Azure Stack HCI 叢集資源頁面,然後選取您的叢集。 在 [功能] 索引標籤下,選取 [深入解析]。

    顯示 [深入解析] 圖格的螢幕快照。

  2. 在 [ 深入解析] 頁面上,選取 [開始使用]。

    顯示 [開始使用] 按鈕的螢幕快照。

  3. 在 [ 深入解析組態 ] 頁面上,從 [ 數據收集規則 ] 下拉式清單中選取現有的 DCR。 DCR 會指定需要收集的事件記錄檔和性能計數器,並將其儲存在 Log Analytics 工作區中。 如果尚未存在,深入解析會建立預設 DCR。 僅包含針對 Insights 啟用的 DCR。

    顯示 [深入解析] 組態視窗的螢幕快照。

  4. (選擇性) 您也可以在 [深入解析設定] 頁面上選取 [Create 新增] 來建立新的 DCR。

    重要

    強烈建議您不要建立自己的 DCR。 Insights 所建立的 DCR 包含其作業所需的特殊數據流。 您可以編輯此 DCR 以收集更多數據,例如 Windows 和 Syslog 事件。 透過 AMA 安裝建立的 DCR 會有附加 DCR 名稱的前置 AzureStackHCI- 詞。

    1. 在 [ 新增數據收集規則 ] 頁面上,指定訂用帳戶、DCR 名稱和數據收集端點, (DCE) 名稱。 DCE 可用來存取設定服務,以擷取 Azure 監視器代理程式的相關聯 DCR。 如需 DCE 的詳細資訊,請參閱 Azure 監視器中的數據收集端點

      注意

      如果您在代理程式上使用私人連結,則必須新增 DCE。 如需 AMA 網路設定的詳細資訊,請參閱 定義 Azure 監視器代理程式網路設定

      顯示資料收集規則視窗的螢幕快照。

    2. 選取 [檢閱 + 建立] 按鈕。

      如果尚未為未受監視的叢集建立 DCR,則會使用啟用性能計數器來建立 DCR,並啟用 Windows 事件記錄通道。

  5. 檢閱最後一個畫面,其中包含 DCR 名稱、事件記錄檔數目、性能計數器,以及儲存數據的 Log Analytics 工作區名稱。 選取 [設定]。

    顯示數據收集規則下拉式選取器的螢幕快照。

    選取 [ 設定] 之後,系統會將您重新導向至 [ 擴充功能 ] 頁面,您可以在其中查看代理程式安裝的狀態。 藉由設定 Insights,AMA 會自動安裝在叢集的所有節點上。

  6. 移至您的 Azure Stack HCI 叢集資源頁面,然後選取您的叢集。 深入解析現在會顯示為 [功能] 索引卷標上的 [設定]:

    顯示 [深入解析] 圖格已設定的螢幕快照。

資料收集規則

當您使用 Azure 監視器代理程式在機器上啟用 Insights 時,您必須指定要使用的 DCR。 如需 DCR 的詳細資訊,請參閱 Azure 監視器中的數據收集規則

選項 描述
效能計數器 指定要從作業系統收集的數據性能計數器。 所有電腦都需要此選項。 這些性能計數器可用來填入 Insights 活頁簿中的視覺效果。 目前,Insights 活頁簿使用五個性能計數器 - Memory()\Available BytesNetwork Interface()\Bytes Total/secProcessor(_Total)\% Processor TimeRDMA Activity()\RDMA Inbound Bytes/sec、 和 RDMA Activity()\RDMA Outbound Bytes/sec
事件記錄通道 指定要從作業系統收集哪些 Windows 事件記錄檔。 所有電腦都需要此選項。 Windows 事件記錄檔可用來填入 Insights 活頁簿中的視覺效果。 目前,數據是透過兩個 Windows 事件記錄檔通道收集: - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Log Analytics 工作區 用來儲存資料的工作區。 只會列出具有 Insights 的工作區。

事件通道

和 Windows 事件通道會新增至 Windows 事件記錄下的 Log Analytics 工作區。Microsoft-windows-health/operationalMicrosoft-windows-sddc-management/operational

顯示 [新增數據源] 視窗的螢幕快照。

藉由收集這些記錄,Insights 會顯示個別伺服器、磁碟驅動器、磁碟區和 VM 的健康狀態。 根據預設,會新增五個性能計數器。

效能計數器

根據預設,會新增五個性能計數器:

顯示已新增性能計數器的螢幕快照。

下表描述這些監視的效能計數器:

效能計數器 描述
Memory(*)\Available Bytes 可用位元組是立即可用於程序配置或系統使用的實體記憶體數量 (以位元組為單位)。
Network Interface(*)\Bytes Total/sec 透過每個網路介面卡傳送和接收的位元組速率 (包含框架字元)。 每秒位元組總計是每秒接收的位元組和每秒傳送的位元組總和。
Processor(_Total)% Processor Time 所有程序執行緒使用處理器執行指令已耗用時間的百分比。
RDMA Activity(*)\RDMA Inbound Bytes/sec 每秒網路介面卡透過 RDMA 接收的資料速率。
RDMA Activity(*)\RDMA Outbound Bytes/sec 每秒網路介面卡透過 RDMA 傳送的資料速率。

啟用深入解析之後,最多可能需要 15 分鐘的時間才能收集資料。 當程式完成時,您可以從左窗格的 [深入解析 ] 功能表看到叢集健康情況的豐富視覺效果:

顯示深入解析視覺效果的螢幕快照。

停用深入解析

若要停用 Insights,請遵循下列步驟:

  1. 在 [功能] 索引標籤下,選取 [深入解析]。

  2. 選取 [停用深入解析]。

    顯示 [停用深入解析] 視窗的螢幕快照。

當您停用 Insights 功能時,會刪除數據收集規則與叢集之間的關聯,且不再收集健全狀況服務和 SDDC 管理記錄;不過,不會刪除現有的數據。 如果您想要刪除該數據,請移至您的 DCR 和 Log Analytics 工作區,然後手動刪除數據。

更新深入解析

深入解析圖格會在下列案例下顯示 [需要更新] 訊息:

  • 數據收集規則已變更。
  • 從 Windows 事件記錄檔中刪除健康情況事件。
  • 從 Log Analytics 工作區刪除五個性能計數器中的任何一個。

若要再次啟用 Insights,請遵循下列步驟:

  1. 選取 [功能] 底下的 [深入解析] 圖格。

  2. 選取 [更新] 以再次查看視覺效果。

    顯示 [更新深入解析] 視窗的螢幕快照。

疑難排解

本節提供使用適用於 Azure Stack HCI 的 Insights 解決問題的指引。

針對未填入數據的空白活頁簿頁面進行疑難解答

問題。 您會看到未填入 資料的空白活 頁簿頁面,如下列螢幕快照所示:

空白活頁簿頁面的螢幕快照。

可能的原因。 此問題可能有數個原因,例如最近設定 Insights 或相關聯 DCR 的設定不正確。

解決方案。 若要針對問題進行疑難解答,請依序執行下列步驟:

  1. 如果您最近設定 Insights,請等候最多一小時,讓 AMA 收集數據。
  2. 確認相關聯 DCR 的組態。 請確定事件通道和性能計數器已新增為相關聯 DCR 的數據源,如 數據收集規則 一節中所述。
  3. 如果在執行上述步驟之後持續發生問題,而且您仍然看不到任何數據,請連絡客戶支援以尋求協助。

如需更詳細的疑難解答指引,請參閱 Azure 監視器代理程式的疑難解答指引

深入解析視覺效果

啟用深入解析之後,下表提供所有資源的詳細資料。

醫療

在叢集上提供健康情況錯誤。

計量 描述 單位 範例
錯誤 健康情況錯誤的簡短描述。 按一下連結時,側邊面板隨即開啟,其中包含詳細資訊。 無單位 PoolCapacityThresholdExceeded
發生錯誤的資源類型 發生錯誤的資源類型。 無單位 StoragePool
發生錯誤的資源識別碼 發生健康情況錯誤之資源的唯一識別碼。 唯一識別碼 {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
嚴重性 錯誤的嚴重性可能是警告或危急。 無單位 警告
初始錯誤時間 上次更新伺服器時的時間戳記。 Datetime 4/9/2022, 12:15:42 PM

伺服器

計量 描述 單位 範例
伺服器 叢集中伺服器的名稱。 無單位 VM-1
上次更新 上次更新伺服器的日期和時間。 Datetime 4/9/2022, 12:15:42 PM
狀態 叢集中伺服器資源的健康情況。 健康情況可以是良好、警告、危急和其他 Healthy
CPU 使用量 程序已使用 CPU 的時間百分比。 百分比 56%
記憶體使用量 伺服器程序的記憶體使用量等於計數器程序\私人位元組加上記憶體對應資料的大小。 百分比 16%
邏輯處理器 邏輯處理器數目。 計數 2
CPU CPU 的數目。 計數 2
Uptime 機器 (特別是電腦) 在作業期間的時間。 Timespan 2.609 小時
網站 伺服器所屬的月臺名稱。 站台名稱 SiteA 的節點上執行
網域名稱 伺服器所屬的本地網域。 無單位 Contoso.local

虛擬機器

提供叢集中所有虛擬機器的狀態。 VM 可以處於下列其中一種狀態:執行中、已停止、已失敗或其他 (未知、啟動中、擷取快照中、儲存中、停止中、暫停中、繼續中、已暫停、已擱置)。

計量 描述 單位 範例
伺服器 伺服器的名稱。 無單位 Sample-VM-1
上次更新 這會提供上次更新伺服器的日期和時間 Datetime 4/9/2022, 12:24:02 PM
VM 總數 伺服器節點中的 VM 數目。 Count 0 個執行中的 0 個
執行中 在伺服器節點中執行的 VM 數目。 計數 2
已停止 伺服器節點中停止的 VM 數目。 計數 3
Failed 伺服器節點中失敗的 VM 數目。 計數 2
其他 如果 VM 處於下列其中一種狀態, (未知、啟動、快照、儲存、停止、暫停、暫停、暫停) ,則會將其視為「其他」。 計數 2

儲存體

下表提供叢集中磁碟區和磁碟驅動器的健康情況:

計量 描述 單位 範例
磁碟區 磁碟區的名稱 無單位 ClusterPerformanceHistory
上次更新 上次更新記憶體的日期和時間。 Datetime 4/14/2022, 2:58:55 PM
狀態 磁碟區的狀態。 良好、警告、危急和其他。 Healthy
容量總計 報表週期間的裝置總容量 (位元組)。 位元組 2.5 GB
可用容量 報告期間的可用容量 (以位元組為單位)。 位元組 20B
Iops 每秒的輸入/輸出作業數。 每秒 45/s
輸送量 應用程式閘道每秒已服務的位元組數目。 每秒位元組數 5B/秒
Latency 完成 I/O 要求的所需時間。 Second 0.0016 秒
災害復原 從失敗中復原的容量。 最大化資料可用性。 無單位 三向鏡像
重複資料刪除 減少需要儲存在磁碟上之數據之實體位元組數目的程式。 可用或無法使用 是/否
檔案系統 檔案系統的類型。 無單位 ReFS

Azure 監視器定價

當您啟用監視視覺效果時,會從下列來源收集記錄:

  • 健康情況管理 (Microsoft-windows-health/operational)。
  • SDDC 管理 (Microsoft-Windows-SDDC-Management/Operational;事件識別碼:3000、3001、3002、3003、3004)。

系統會根據擷取的數據量和Log Analytics工作區的數據保留設定來計費。

Azure 監視器採用隨用隨付定價,且每月每個計費帳戶的前 5 GB 是免費的。 由於定價可能因多個因素而異 (例如您正在使用的 Azure 區域),因此請瀏覽 Azure 監視器定價計算機,以取得最新的定價計算。

下一步