Share via


規劃警示和自動化動作

警示會主動通知您在監視資料中發現了重要資料或模式。 您可以建立警示,用以:

  • 傳送主動式通知。
  • 起始自動化動作以嘗試補救問題。

警示規則是由所使用的資料類型所定義。 每種都有不同功能和不同成本。 基本策略是使用具備您所需邏輯、且成本最低的警示規則類型。 請參閱選擇正確的警示規則類型

如需警示的詳細資訊,請參閱警示概觀

警示策略

定義警示策略可協助您定義警示規則的設定,包括警示嚴重性和動作群組。

如需開發警示策略時應考量的因素,請參閱成功的警示策略

警示的自動化回應

使用動作群組來定義警示的自動化回應。 動作群組是警示所觸發一或多個通知和動作的集合。 單一動作群組可以搭配多個警示規則使用,並包含下列一或多個項目:

  • 通知:通知操作員和管理員已建立警示的訊息。
  • 動作:嘗試更正偵測到之問題的自動化程序。

通知

通知是傳送給一或多個使用者的訊息,通知他們已建立警示。 由於單一動作群組可以搭配多個警示規則使用,因此您應為接收相同警示集合的不同管理員和使用者集合,設計一組動作群組。 根據操作員偏好和組織標準,使用下列任一類型的通知:

  • 電子郵件
  • SMS
  • 推送至 Azure 應用程式
  • 語音
  • 寄送電子郵件給 Azure Resource Manager 角色

動作

動作是警示的自動化回應。 您可以針對支援的任何情節使用可用的動作,但下列各節會說明每個動作的一般使用方式。

建議的補救方式

使用下列動作來自動化補救警示找到的問題:

  • 自動化 Runbook:在 Azure 自動化中啟動內建 Runbook 或自訂 Runbook。 例如,內建 Runbook 可用來執行重新啟動或擴大虛擬機器等功能。
  • Azure Functions - 啟動 Azure 函式。

ITSM 和待命管理

  • IT 服務管理 (ITSM):使用 ITSM 連接器,根據來自 Azure 監視器的警示,在 ITSM 工具中建立工作項目。 您必須先設定連接器,然後使用警示規則中的 ITSM 動作。
  • Webhook:將警示傳送至支援 Webhook 的事件管理系統,如 PagerDuty 和 Splunk On-Call。
  • 安全 Webhook:整合 ITSM 與 Microsoft Entra 驗證。

大規模警示

作為警示策略的一部分,您會想要針對所有重要 Azure 應用程式和資源的問題發出警示。 如需指導,請參閱大規模警示

將警示活動降到最低

您想要為環境中的任何重要資訊建立警示。 但您不想要為不重要的問題建立過多警示和通知。 若要將警示活動降到最低,以確保會顯示重大問題,同時不會對管理員產生過多資訊和通知,請遵循下列指導方針:

  • 請參閱成功的警示策略,以判斷徵兆是否適合發出警示。
  • 使用計量警示規則中的 [自動解決警示] 選項,在修正狀況後解決警示。
  • 記錄搜尋查詢警示規則中使用 [隱藏警示] 選項,以避免對相同問題建立多個警示。
  • 務必對警示規則使用適當的嚴重性層級,以便分析高優先順序問題。
  • 限制嚴重性為警告或更低之警示的通知,因為這些警示不需要立即關注。

下一步

在 Azure 監視器中最佳化成本