什麼是 Azure 監視器警示?

警示可在 Azure 監視器資料指出基礎結構或應用程式可能有問題時主動通知您,協助您在使用者注意到問題之前偵測並解決問題。

您可以針對在 Azure 監視器資料平台中的任何計量或記錄資料來源發出警示。

下圖顯示警示的運作方式。

Diagram that explains Azure Monitor alerts.

警示規則會監視您的數據,並擷取指出指定資源發生狀況的訊號。 警示規則會擷取訊號,並檢查訊號是否符合您的條件準則。

警示規則結合:

  • 要監視的資源。
  • 來自資源的訊號或資料。
  • 條件。

如果符合警示規則的條件,就會觸發警示。 警示會起始相關聯的動作群組,並更新警示的狀態。 如果您要監視多個資源,則會針對每個資源分別評估警示規則條件,並個別針對每個資源引發警示。

警示會儲存 30 天,並在 30 天的保留期間之後刪除。 您可以在 Azure 入口網站 的 [警示] 頁面上看到所有 Azure 資源的所有警示實例。

警示包含:

  • 動作群組:這些群組可以觸發通知或自動化工作流程,讓使用者知道已觸發警示。 動作群組可以包括:
    • 通知方法,例如電子郵件、SMS 和推播通知。
    • 自動化 Runbook。
    • Azure 函式。
    • ITSM 事件。
    • 邏輯應用程式。
    • 保護 Webhook。
    • Webhook。
    • 事件中樞。
  • 警示條件:這些條件是由系統設定。 當警示引發時,警示條件會設定為 引發。 在引發警示的基礎條件清除之後,警示條件會設定為 解決。
  • 使用者回應:回應是由用戶設定,在用戶變更之前不會變更。
  • 警示處理規則:您可以使用警示處理規則,在觸發警示時修改觸發的警示。 您可以使用警示處理規則來新增或隱藏動作群組、套用篩選條件,或讓規則在預先定義的排程上處理。

警示類型

下表提供每個警示類型的簡短描述。 如需每個警示類型以及如何選擇最符合您需求之警示類型的詳細資訊,請參閱 Azure 監視器警示的類型。

警示類型 描述
計量警示 \(部分機器翻譯\) 計量警示會定期評估資源計量。 這些計量可以是平台計量、自訂計量、Azure 監視器轉換成計量的記錄,或 Application Insights 計量。 計量警示還可以套用多個條件和動態閾值。
記錄搜尋警示 記錄搜尋警示可讓使用者使用Log Analytics查詢,以預先定義的頻率評估資源記錄。
活動記錄警示 \(部分機器翻譯\) 當發生符合已定義條件的新活動記錄事件時,就會觸發活動記錄警示。 資源健康狀態警示和服務健康情況警示是報告服務和資源健康狀態的活動記錄警示。
智慧偵測警示 Application Insights 資源上的 [智慧偵測] 會自動警告您 Web 應用程式中潛在的效能問題和失敗異常。 在 Application Insights 資源上移轉智慧偵測,以建立不同智慧偵測模組的警示規則。
Prometheus 警示 Prometheus 警示用於針對 Prometheus 儲存在 Azure 監視器受控服務中的 Prometheus 計量發出警示。 警示規則是以 PromQL 開放原始碼查詢語言為基礎。

警示和狀態

警示可以是具狀態或無狀態。

  • 每次符合條件時都會引發無狀態警示,即使先前引發也一樣。
  • 符合規則條件時會引發具狀態警示,而且在解決條件之前,不會再次引發或觸發任何動作。

警示會儲存 30 天,並在 30 天的保留期間之後刪除。

無狀態警示

每次符合條件時都會引發無狀態警示。 所有無狀態警示的警示條件一律 fired為 。

  • 所有活動記錄警示都是無狀態的。
  • 無狀態計量警示的通知頻率會根據警示規則的設定頻率而有所不同:
    • 警示頻率少於 5 分鐘:雖然條件持續符合,但通知會在一到六分鐘之間傳送。
    • 警示頻率超過 5 分鐘:當條件持續符合時,會在設定的頻率與頻率兩倍之間傳送通知。 例如,針對頻率為 15 分鐘的警示規則,有時會在 15 到 30 分鐘之間傳送通知。

具狀態警示

符合規則條件時會引發具狀態警示,而且在解決條件之前,不會再次引發或觸發任何動作。 具狀態警示的警示條件為 fired,直到視為已解決為止。 當警示視為已解決時,警示規則會使用 Webhook 或電子郵件傳送已解決的通知,而警示條件會設定為 resolved

針對具狀態警示,當警示本身在 30 天后刪除時,警示條件會儲存到警示解決之前,以避免引發另一個警示,並在解決警示時傳送通知。

具狀態記錄搜尋警示有限制 - 這裡的詳細數據

下表描述何時將具狀態警示視為已解決:

警示類型 警示會在何時解決
計量警示 \(部分機器翻譯\) 連續三次檢查不符合警示條件。
記錄搜尋警示 特定時間範圍不符合警示條件。 時間範圍會根據警示的頻率而有所不同:
  • 1 分鐘:不符合警示條件 10 分鐘。
  • 5 到 15 分鐘:三個頻率期間不符合警示條件。
  • 15 分鐘到 11 小時:兩個頻率期間不符合警示條件。
  • 11 到 12 小時:一個頻率期間不符合警示條件。

您可以在 Azure 入口網站 中啟用建議的現用警示規則。

系統會編譯建議的警示規則清單,根據:

  • 資源提供者對於監視資源的重要訊號和閾值的知識。
  • 告知我們客戶通常對此資源發出的警示的資料。

注意

已針對下列項目啟用建議的警示規則:

  • 虛擬機器
  • AKS 資源
  • Log Analytics 工作區

大規模警示

您可以使用下列任一方法來大規模建立警示規則。 每個選擇都有可能會對成本和警示規則維護產生影響的優缺點。

計量警示 \(部分機器翻譯\)

您可以使用 一個計量警示規則來監視相同 Azure 區域中相同類型的多個資源 。 系統會針對每個受監視的資源傳送個別通知。 如需此功能目前支援的 Azure 服務清單,請參閱 Azure 監視器中計量警示的支持資源。

針對不支援多個資源的 Azure 服務的計量警示規則,請使用 Azure CLI、PowerShell 或 Azure Resource Manager 範本等自動化工具,為多個資源建立相同的警示規則。 如需 ARM 範例,請參閱 Azure 監視器中計量警示規則的 Resource Manager 範例。

每個計量警示規則都會根據所監視的時間序列數目來收費。

記錄搜尋警示

使用 記錄搜尋警示規則 來監視將數據傳送至 Log Analytics 工作區的所有資源。 這些資源可以來自任何訂用帳戶或區域。 設定 Log Analytics 工作區時,請使用資料收集規則,以收集記錄搜尋警示規則的必要數據。

您也可以使用分割維度來建立以資源為中心的警示,而不是以工作區為中心的警示。 當您在 resourceId 數據行上分割時,每個資源都會收到一個符合條件的警示。

使用依維度分割的記錄搜尋警示規則會根據查詢所產生的維度所建立的時間序列數目收費。 如果數據已收集到 Log Analytics 工作區,則不需要額外費用。

如果您在Log Analytics工作區中大規模使用計量數據,價格會根據數據擷取而變更。

使用 Azure 原則大規模警示

您可以使用 Azure 原則 來大規模設定警示。 這具有輕鬆大規模實作警示的優點。 您可以看到如何使用 Azure 監視器基準警示來實 作此動作

請記住,如果您使用原則來建立警示規則,可能會增加維護大型警示規則集的額外負荷。

警示的 Azure 角色型訪問控制

您只能存取、建立或管理您具有權限之資源的警示。

若要建立警示規則,您必須具備:

  • 警示規則目標資源的讀取權限。
  • 建立警示規則所在之資源群組的寫入權限。 如果您要從 Azure 入口網站建立警示規則,警示規則預設會在目標資源所在的相同資源群組中建立。
  • 與警示規則相關聯的任何動作群組的讀取權限 (如果適用)。

這些內建的 Azure 角色在所有 Azure Resource Manager 範圍中都受到支援,具有存取警示資訊及建立警示規則的權限:

  • 監視參與者:參與者可以在其範圍內建立警示並使用資源。
  • 監視讀取者:讀取者可以檢視警示,並在其範圍內讀取資源。

如果目標動作群組或規則位置位於與兩個內建角色不同的範圍內,請建立具有適當許可權的使用者。

定價

如需定價的相關信息,請參閱 Azure 監視器定價

下一步