Azure Resource Graph 中的 VM 可用性資訊

Azure Resource Graph 是一項 Azure 服務,可讓您使用記錄查詢中使用的相同 KQL 查詢語言,以複雜的篩選、分組和依資源屬性排序大規模查詢您的 Azure 資源。 您可以使用 VM 健康情況註釋 至 Azure Resource Graph (ARG),進行詳細的失敗歸因和停機時間分析,包括下列項目:

  • 在所有 Azure 訂用帳戶中一起查詢 VM 可用性的最新快照集。
  • 評估對企業 SLA 的影響,並觸發果斷的緩和動作,以回應中斷和失敗簽章的類型。
  • 設定自訂儀表板,藉由 聯結 VM 可用性資訊與 Resource Graph 中其他 資源中繼資料,來監督應用程式的完整健康情況。
  • 使用 變更追蹤 機制來執行詳細調查,在 14 天內追蹤 VM 可用性的相關變更。

若要開始使用 Resource Graph,請在 Azure 入口網站中開啟 Resource Graph 總管。 選取 [資料表] 索引標籤,並查看 microsoft.resourcehealth/availabilitystatusesmicrosoft.resourcehealth/resourceannotations 資料表,如下所述。 按一下 [healthresources] 以建立簡單的查詢,然後按一下 [執行] 以傳回記錄。

Screenshot of Azure Resource Graph with simple healthresources query.

若要檢視記錄的詳細資料,請向右卷動並選取 [查看詳細資料]

Screenshot of Azure Resource Graph healthresources detailed record.

HealthResources 資料表中會填入兩種類型的事件:

microsoft.resourcehealth/availabilitystatuses

此事件會表示 VM 的最新可用性狀態,這是根據基礎 Azure 平台所執行的 健康情況檢查。 目前針對 VM 發出的 可用性狀態 如下所示:

  • 可用: VM 已如預期般啟動並執行。
  • 無法使用: 偵測到 VM 正常運作中斷。
  • 不明: 平台無法正確偵測 VM 的健康情況。 請在數分鐘後重試。

可用性狀態位於記錄的 [properties] 欄位中,其中包含下列屬性:

欄位 描述
targetResourceType 健康情況資料流動的資源類型
targetResourceId 資源識別碼
occurredTime 平台發出最新可用性狀態時的時間戳記
previousAvailabilityState VM 之前的可用性狀態
availabilityState VM 目前的可用性狀態

範例 properties 值看起來如下:

{
    "targetResourceType": "Microsoft.Compute/virtualMachines",
    "targetResourceId": "/subscriptions/<subscriptionId>/resourceGroups/<ResourceGroupName>/providers/Microsoft.Compute/virtualMachines/<VMName>",
    "occurredTime": "2022-10-11T11:13:59.9570000Z",
    "previousAvailabilityState": "Available",
    "availabilityState": "Unavailable"
}

microsoft.resourcehealth/resourceannotations

此事件會將 VM 可用性的任何變更內容化,方法是詳細說明必要的失敗屬性,以協助您視需要調查及減輕中斷情況。 VM 健康情況註釋的完整列表會列於 [資源健康狀態虛擬機器健康情況註釋] (../service-health/resource-health-vm-annotation.md)。

這些註釋可廣泛分類為下列各項:

  • 停機時間註釋: 當平台偵測到 VM 可用性轉換至無法使用時發出。 範例包括主機當機或重新啟動作業。
  • 資訊註釋: 在控制平面活動期間發出,不會影響 VM 可用性。 範例包括 VM 配置、停止、刪除、啟動。 通常,回應中不需要採取其他客戶動作。
  • 降級註釋: 偵測到 VM 可用性有風險時發出。 範例包括當失敗預測模型預測會導致 VM 在任何指定時間重新啟動的降級硬體元件時。 您應該依照註釋訊息中指定的期限重新部署,以避免任何未預期的資料遺失或停機時間。
欄位 描述
targetResourceType 健康情況資料流動的資源類型
targetResourceId 資源識別碼
occurredTime 平台發出最新可用性狀態時的時間戳記
annotationName 發出之註釋的名稱
reason 客戶觀察到之可用性影響的簡短概觀
category 表示觸發註釋的平台活動是屬計劃性維護還是非計劃性修復。 此欄位不適用於客戶/VM 起始的事件。

可能的值: 計劃性 |非計劃性 |不適用 | Null
內容 表示觸發註釋的活動是由授權的使用者或流程 (客戶起始) 所造成的、由 Azure 平台 (平台起始)所造成的,還是客體 OS 中的活動 (VM 起始)所造成的可用性影響。

可能的值: 平台起始 | 使用者起始 |VM 起始 |不適用 | Null
摘要 詳細說明註釋發出原因的陳述式,以及使用者可採取的補救步驟

如需使用此資料的範例查詢,請參閱 依資料表排序的 Azure Resource Graph 範例查詢

下一步