Share via


使用 Azure 監視器進行大規模監視

Azure 備份提供復原服務保存庫中的內建監視和警示功能。 您不需要任何額外的管理基礎結構,即可使用這些功能。 但在下列案例中,這項內建服務會受到限制:

  • 如果您在訂用帳戶之間監視多個復原服務保存庫中的資料
  • 如果慣用的通知通道不是電子郵件
  • 如果使用者想要更多案例的警示
  • 如果您想要從 Azure 中的內部部署元件 (例如 System Center Data Protection Manager) 中檢視資訊,但入口網站未顯示在備份作業備份警示

使用 Log Analytics 工作區

使用 Log Analytics 建立警示

在 Azure 監視器中,您可以在 Log Analytics 工作區中建立自己的警示。 在工作區中,您可以使用 Azure 動作群組選取您慣用的通知機制。

重要

如需建立此查詢的成本詳細資訊,請參閱 Azure 監視器定價

開啟 Log Analytics 工作區的 [記錄] 區段,然後為您自己的記錄建立查詢。 在您選取 [新增警示規則] 時,Azure 監視器警示建立頁面會開啟,如下圖所示。

Create an alert in a Log Analytics workspace

這裡的資源已標示為 Log Analytics 工作區,並提供動作群組整合。

The Log Analytics alert-creation page

警示條件

警示的定義特性是其觸發條件。 選取 [條件],在 [記錄] 頁面上自動載入 Kusto 查詢,如下圖所示。 您可以在這裡編輯條件,以符合您的需求。 如需詳細資訊,請參閱 範例 Kusto 查詢

Setting up an alert condition

如有必要,您可以編輯 Kusto 查詢。 選擇閾值、期間和頻率。 閾值會決定何時會引發警示。 期間是執行查詢的時間範圍。 例如,如果閾值大於 0、期間為 5 分鐘,且頻率為5分鐘,則規則會每隔 5 分鐘執行一次查詢,並檢閱前 5 分鐘。 如果結果數目大於 0,您就會透過選取的動作群組收到通知。

注意

若要每天執行一次警示規則,請在指定日建立的所有事件/記錄中,將「週期」和「頻率」兩者的值變更為 1440,亦即 24 小時。

警示動作群組

使用動作群組來指定通知通道。 若要檢視可用的通知機制,請在 [動作群組] 下,選取 [新建]

Available notification mechanisms in the

您可以單獨滿足 Log Analytics 中的所有警示和監視需求,也可以使用 Log Analytics 補充內建通知。

如需詳細資訊,請參閱使用 Azure 監視器建立、查看和記錄管理警示在 Azure 入口網站中建立和管理動作群組

範例 Kusto 查詢

預設圖形會提供您可以建立警示的基本案例有關的 Kusto 查詢。 您也可以修改查詢,以擷取您想要收到警示的資料。 將下列範例 Kusto 查詢貼入 [記錄] 頁面,然後在查詢上建立警示。

復原服務保存庫和備份保存庫會將資料傳送至本文所列的一組常見資料表。 不過,復原服務保存庫和備份保存庫的結構描述稍有差異 (深入了解)。 因此,本節分成多個子區段,可協助您根據您想要查詢的工作負載或保存庫類型,使用正確的查詢。

復原服務保存庫和備份保存庫的常見查詢

  • 所有成功的備份作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where JobStatus=="Completed"
    
  • 所有失敗的備份作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where JobStatus=="Failed"
    

復原服務保存庫工作負載特定的查詢

  • 所有成功的 Azure VM 備份作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where JobStatus=="Completed"
    | join kind=inner
    (
        CoreAzureBackup
        | where OperationName == "BackupItem"
        | where BackupItemType=="VM" and BackupManagementType=="IaaSVM"
        | distinct BackupItemUniqueId, BackupItemFriendlyName
    )
    on BackupItemUniqueId
    
  • 所有成功的 SQL 記錄備份作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup" and JobOperationSubType=="Log"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where JobStatus=="Completed"
    | join kind=inner
    (
        CoreAzureBackup
        | where OperationName == "BackupItem"
        | where BackupItemType=="SQLDataBase" and BackupManagementType=="AzureWorkload"
        | distinct BackupItemUniqueId, BackupItemFriendlyName
    )
    on BackupItemUniqueId
    
  • 所有成功的 Azure 備份代理程式作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where JobStatus=="Completed"
    | join kind=inner
    (
        CoreAzureBackup
        | where OperationName == "BackupItem"
        | where BackupItemType=="FileFolder" and BackupManagementType=="MAB"
        | distinct BackupItemUniqueId, BackupItemFriendlyName
    )
    on BackupItemUniqueId
    
  • 每個備份項目使用的備份儲存體

    CoreAzureBackup
    //Get all Backup Items
    | where OperationName == "BackupItem"
    //Get distinct Backup Items
    | distinct BackupItemUniqueId, BackupItemFriendlyName
    | join kind=leftouter
    (AddonAzureBackupStorage
    | where OperationName == "StorageAssociation"
    //Get latest record for each Backup Item
    | summarize arg_max(TimeGenerated, *) by BackupItemUniqueId
    | project BackupItemUniqueId , StorageConsumedInMBs)
    on BackupItemUniqueId
    | project BackupItemUniqueId , BackupItemFriendlyName , StorageConsumedInMBs
    | sort by StorageConsumedInMBs desc
    

備份保存庫工作負載特定的查詢

  • 所有成功的 Azure PostgreSQL 備份作業

    AddonAzureBackupJobs
    | where JobOperation=="Backup"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
      | where DatasourceType == "Microsoft.DBforPostgreSQL/servers/databases"
    | where JobStatus=="Completed"	
    
  • 所有成功的 Azure 磁碟還原作業

    AddonAzureBackupJobs
    | where JobOperation == "Restore"
    | summarize arg_max(TimeGenerated,*) by JobUniqueId
    | where DatasourceType == "Microsoft.Compute/disks"
    | where JobStatus=="Completed"
    
  • 每個備份項目使用的備份儲存體

    CoreAzureBackup
    | where OperationName == "BackupItem"
    | summarize arg_max(TimeGenerated, *) by BackupItemUniqueId
    | project BackupItemUniqueId, BackupItemFriendlyName, StorageConsumedInMBs
    

診斷資料更新頻率

保存庫中的診斷資料會抽出至 Log Analytics 工作區,並且有一些延遲。 每個事件都會在從復原服務保存庫推送之後的 20 到 30 分鐘抵達 Log Analytics 工作區。 以下是延遲的進一步詳細資料:

  • 在所有解決方案中,備份服務的內建警示會在建立後立即推送。 因此,這些通常會在 20 到 30 分鐘後出現在 Log Analytics 工作區中。
  • 在所有解決方案中,隨選備份作業和還原作業會在完成時立即推送。
  • 如果是 SQL 和 SAP HANA 備份之外的解決方案,排程的備份作業會在完成時立即推送。
  • 如果是 SQL 和 SAP HANA 備份,因為記錄備份可能每隔 15 分鐘發生一次,所以所有已完成的排程備份作業 (包括記錄) 的資訊每隔 6 小時會進行批次處理和推送。
  • 在所有解決方案中,其他資訊 (例如,備份項目、原則、復原點、儲存體等等) 會一天至少一次推送。
  • 備份設定的變更 (例如變更原則或編輯原則) 會觸發所有相關備份資訊的推送。

注意

相同的延遲適用於診斷資料的其他目的地,例如儲存體帳戶和事件中樞。

使用復原服務保存庫的活動記錄

警告

下列步驟僅適用於 Azure VM 備份。您無法將這些步驟用於 Azure 備份代理程式、Azure 中的 SQL 備份或 Azure 檔案儲存體等解決方案。

您也可以使用活動記錄來取得事件通知 (例如備份成功)。 若要開始,請依照下列步驟進行:

  1. 登入 Azure 入口網站。
  2. 開啟相關的復原服務保存庫。
  3. 在保存庫的 [屬性] 中,開啟 [活動記錄] 區段。

若要識別適當的記錄並建立警示:

  1. 套用下圖中顯示的篩選,以確認您是否正在接收成功備份的活動記錄。 視需要變更時間範圍值以檢視記錄。

    Filtering to find activity logs for Azure VM backups

  2. 選取作業名稱以檢視相關的詳細資料。

  3. 選取 [新增警示規則] 開啟 [建立規則] 頁面。

  4. 遵循使用 Azure 監視器建立、查看和管理活動記錄警示中的步驟建立警示。

    New alert rule

這裡的資源是復原服務保存庫本身。 針對您想要透過活動記錄收到通知的所有保存庫,重複相同的步驟。 條件不會有閾值、期間或頻率,因為此警示是以事件為基礎。 一旦產生相關的活動記錄檔,就會引發警示。

使用 Log Analytics 大規模監視

您可以在 Azure 監視器中,從活動記錄和 Log Analytics 工作區中檢視建立的所有警示。 只要開啟左側的 [警示] 窗格即可。

雖然您可以透過活動記錄取得通知,但我們強烈建議使用 Log Analytics 而非活動記錄大規模進行監視。 原因如下:

  • 有限案例: 活動記錄的通知僅適用於 Azure VM 備份。 必須為每個復原服務保存庫設定通知。
  • 定義符合: 排程的備份活動不符合最新的活動記錄定義。 相反地,它會與資源記錄檔一致。 當流經活動記錄通道的資料變更時,這種對齊方式會導致非預期的效果。
  • 活動記錄通道的問題: 在復原服務保存庫中,從 Azure 備份抽出的活動記錄會遵循新的模型。 可惜的是,這項變更會影響由 21Vianet 運作的 Azure Government、Azure 德國和 Microsoft Azure 中的活動記錄產生。 如果這些雲端服務的使用者在 Azure 監視器中,從活動記錄建立或設定任何警示,則不會觸發警示。 此外,在所有 Azure 公用區域中,如果使用者要將復原服務活動記錄收集到 Log Analytics 工作區,則這些記錄也不會出現。

針對 Azure 備份保護的所有工作負載,使用 Log Analytics 工作區進行大規模監視和警示。

下一步

若要建立自訂查詢,請參閱 Log Analytics 資料模型