你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

监视 Azure 备份工作负荷

Azure 备份根据备份要求和基础结构拓扑(本地或 Azure)提供多个备份解决方案。 任何备份用户或管理员都应看到所有解决方案中发生的情况,并会在出现重大情况时收到通知。 本文详细介绍了 Azure 备份服务提供的监视和通知功能。

注意

还可以通过备份中心访问以下部分中描述的功能。 备份中心是 Azure 中的一种统一管理体验。 它使企业能够大规模管理、监视、操作和分析备份。 使用此解决方案,你可以执行大多数密钥备份管理操作,而不必局限于单个保管库的范围。

恢复服务保管库中的备份项

可通过恢复服务保管库监视所有备份项。 导航到“备份中心”的“备份实例”部分,此时会打开一个视图,其中显示给定工作负荷类型的所有备份项的详细列表,以及每个项的上次备份状态、可用的最新还原点等信息。

Screenshot showing to view Recovery Services vault backup items.

注意

对于使用 DPM 备份到 Azure 的项,该列表将显示使用 DPM 服务器保护的所有数据源(包括磁盘和联机数据源)。 如果对保留了备份数据的数据源停止保护,则该数据源仍会在门户中列出。 可访问数据源的详细信息,查看恢复点是否存在于磁盘、联机或同时存在于这两者中。 此外,对于联机保护已停止但数据仍保留的数据源,在数据完全删除之前,将继续对联机恢复点进行计费。

DPM 版本必须是 DPM 1807 (5.1.378.0) 或 DPM 2019(10.19.58.0 或更高版本),才能在恢复服务保管库门户中显示备份项。

对于 DPM、MABS 和 MARS,备份项(VM 名称、群集名称、主机名、卷或文件夹名称)和保护组不能包含“<”、“>”、“%”、“&”、“:”、''、“?”、“/”、“#”或任何控制字符。

备份中心的备份作业

Azure 备份针对 Azure 备份保护的工作负荷提供内置的监视和警报功能。 导航到“备份中心”的“备份作业”窗格,可以查看保管库中最近的备份和还原作业。

Screenshot showing the Recovery Services vault built-in monitoring.

执行配置备份、备份、还原、删除备份等操作时,会生成作业。

此处会显示以下 Azure 备份解决方案中的作业:

  • Azure VM 备份
  • Azure 文件备份
  • Azure 工作负荷备份,例如 SQL 和 SAP HANA 备份
  • Microsoft Azure 恢复服务 (MARS) 代理

不会显示 System Center Data Protection Manager (SC-DPM) 和 Microsoft Azure 备份服务器 (MABS) 中的作业。

注意

  • Azure VM 中的 Azure 工作负荷(例如 SQL 和 SAP HANA 备份)包含大量的备份作业。 例如,日志备份可能每隔 15 分钟运行一次。 因此,对于此类数据库工作负荷,只会显示用户触发的操作。 不会显示计划的备份操作。
  • 在备份中心,可查看过去 14 天的作业。 如果要查看较长持续时间内的作业,可转到各个恢复服务保管库并选择“备份作业”选项卡。对于超过 6 个月的作业,建议使用 Log Analytics 和/或备份报告可靠、高效地查询旧作业。

Azure 备份的 Azure Monitor 警报

Azure 备份还通过 Azure Monitor 提供警报,使你能够在不同的 Azure 服务(包括 Azure 备份)中获得一致的警报管理体验。 使用 Azure Monitor 警报可将警报路由到 Azure Monitor 支持的任何通知通道,例如电子邮件、ITSM、Webhook、逻辑应用等。

Azure 备份目前提供两种主要类型的内置警报:

  • 安全警报:在删除了备份数据或禁用了保管库的软删除功能等情况下,安全警报(严重性为“严重性 0”)将会触发并显示在 Azure 门户中,或者可以通过其他客户端(PowerShell、CLI 和 REST API)使用这些警报。 默认会生成安全警报,且无法将其关闭。 但是,可以控制要对其触发通知(例如电子邮件通知)的场景。 有关如何配置通知的详细信息,请参阅操作规则
  • 作业失败警报:对于备份失败和还原失败等情况,Azure 备份通过 Azure Monitor 提供内置警报(严重性为“严重性 1”)。 不同于安全警报,可以选择关闭针对作业失败场景的 Azure Monitor 警报。 例如,你已通过 Log Analytics 为作业失败配置自定义警报规则,且不需要为每个作业失败触发内置警报。 作业失败警报默认打开。 有关详细信息,请参阅有关针对这些场景打开警报的部分

下表汇总了当前通过 Azure Monitor 提供的各种备份警报和支持的工作负载/保管库类型:

警报类别 警报名称 支持的工作负载类型/保管库类型 说明
安全性 删除备份数据 - Microsoft Azure 虚拟机

- Azure VM 中的 SQL(非 AG 方案)

- Azure VM 中的 SAP HANA

- Azure 备份代理

- DPM

- Azure 备份服务器

- Azure Database for PostgreSQL 服务器

- Azure Blob

- Azure 托管磁盘
停止备份并删除备份数据时,将触发此警报。

注意
如果为保管库禁用了软删除功能,则不会收到“删除备份数据”警报。
安全性 即将清除 - Azure 虚拟机

- Azure VM 中的 SQL

- Azure VM 中的 SAP HANA
对于支持软删除的所有工作负载,当某个项的备份数据在 2 天后就会被 Azure 备份服务永久清除时,将触发此警报。
安全性 清除完成 - Azure 虚拟机

- Azure VM 中的 SQL

- Azure VM 中的 SAP HANA
删除备份数据
安全性 为保管库禁用了软删除 恢复服务保管库 当 Azure 备份服务永久删除了某个项的软删除备份数据时,将触发此警报。
安全性 修改保留时间较短的策略 - Azure 虚拟机

- Azure VM 中的 SQL

- Azure VM 中的 SAP HANA

- Azure 文件存储
当修改备份策略以使用较少的保留期时,将触发此警报。
安全性 修改保留时间较短的保护 - Azure 虚拟机

- Azure VM 中的 SQL

- Azure VM 中的 SAP HANA

- Azure 文件存储
当将备份实例分配到保留时间较短的其他策略时,将触发此警报。
安全性 MUA 已禁用 恢复服务保管库 当用户禁用保管库的 MUA 功能时,将触发此警报。
安全性 禁用混合安全性功能 恢复服务保管库 为保管库禁用混合安全性设置时会触发此警报。
作业 备份失败 - Azure 虚拟机

- Azure VM 中的 SQL

- Azure VM 中的 SAP HANA

- Azure 备份代理

- Azure 文件存储

- Azure Database for PostgreSQL 服务器

- Azure 托管磁盘
发生备份作业失败时,将触发此警报。 针对备份失败的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分
作业 还原失败 - Azure 虚拟机

- Azure VM 中的 SQL(非 AG 方案)

- Azure VM 中的 SAP HANA

- Azure 备份代理

- Azure 文件存储

- Azure Database for PostgreSQL 服务器

- Azure Blob

- Azure 托管磁盘
发生还原作业失败时,将触发此警报。 针对还原失败的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分
作业 不支持的备份类型 - Azure VM 中的 SQL

- Azure VM 中的 SAP HANA
当数据库的当前设置不支持策略中的特定备份类型时,将触发此警报。 针对不受支持备份类型场景的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分
作业 工作负载扩展不正常 - Azure VM 中的 SQL

- Azure VM 中的 SAP HANA
当用于数据库备份的 Azure 备份工作负载扩展处于不正常状态(这可能会导致将来的备份失败)时,将触发此警报。 针对工作负载扩展不正常场景的警报默认已打开。 有关详细信息,请参阅有关针对此场景打开警报的部分

注意

  • 对于 Azure VM 备份,在删除基础 VM 或另一个备份作业已在进行中(导致另一个备份作业失败)的情况下,不会发送备份失败警报。 这是因为,这些方案预期备份会按设计失败,因此这两种情况下不会生成警报。

打开针对作业失败场景的 Azure Monitor 警报

若要选择打开针对备份失败和还原失败场景的 Azure Monitor 警报,请执行以下步骤:

选择保管库类型

默认情况下,为作业失败生成内置的 Azure Monitor 警报。 如果要关闭这些方案的警报,可以相应地编辑保管库的监视设置属性。

若要管理备份保管库的监视设置,请执行以下步骤:

  1. 转到保管库并选择“属性”。

  2. 找到“监视设置”保管库属性,然后选择“更新”。

    Screenshot showing how to update monitoring settings in Recovery Services vault.

  3. 在上下文窗格中,选择适当的选项,根据要求启用/禁用作业失败的内置 Azure Monitor 警报。

    Screenshot showing options to enable or disable built-in Azure Monitoring alerts.

  4. 我们还建议选中“仅使用 Azure Monitor 警报”复选框。

    通过选择此选项,你同意仅通过 Azure Monitor 接收备份警报,并且将停止接收来自旧版经典警报解决方案的警报。 查看经典警报和内置 Azure Monitor 警报之间的主要差别

    Screenshot showing the option to enable receiving backup alerts.

  5. 选择“更新”以保存保管库的设置。

在 Azure 门户中查看已触发的警报

为保管库触发警报后,你可以转到备份中心在 Azure 门户中查看警报。 在“概述”选项卡中可以看到按严重性划分的活动警报汇总。 其中显示了两种类型的警报:

  • 数据源警报:与正在备份的特定数据源关联的警报(例如,VM 备份或还原失败、删除数据库备份数据等)显示在“数据源警报”部分下。
  • 全局警报:不与特定数据源关联的警报(例如,禁用保管库软删除功能)显示在“全局警报”部分下。

以上每种警报类型又进一步划分为“安全”和“已配置”警报。 目前,安全警报包括删除备份数据或禁用保管库软删除(针对上节详述的适用工作负载)的场景。 配置的警报包括备份失败和还原失败,因为这些警报仅在未针对这些方案禁用警报时触发。

Screenshot for viewing alerts in Backup center.

选择任一数字(或“警报”菜单项)会打开一个列表,其中列出了触发的所有活动警报和应用的相关筛选器。 可以根据各种属性(例如订阅、资源组、保管库、严重性、状态等)进行筛选。 可以选择任一警报以查看有关该警报的更多详细信息,例如受影响的数据源、警报说明和建议的操作,等等。

Screenshot for viewing details of the alert.

可以选择“更改警报状态”将警报的状态更改为“已确认”或“已关闭”。

Screenshot for changing state of the alert.

注意

  • “备份中心”目前仅显示针对基于 Azure 的工作负载的警报。 若要查看针对本地资源的警报,请转到恢复服务保管库,然后选择“警报”菜单项。
  • 备份中心仅显示 Azure Monitor 警报。 由较旧警报解决方案(通过恢复服务保管库中的“备份警报”选项卡访问)引发的警报不会显示在备份中心。 有关 Azure Monitor 警报的详细信息,请参阅 Azure 中的警报概述
  • 目前,对于 Blob 还原警报,只有当创建警报规则时同时选择了 datasourceId 和 datasourceType 维度时,警报才会显示在数据源警报下。 如果未选择任何维度,警报将显示在全局警报下。

配置警报的通知

若要配置 Azure Monitor 警报通知,请创建警报处理规则。 若要创建警报处理规则(之前称为操作规则)将电子邮件通知发送到给定的电子邮件地址,请执行以下步骤。 此外,请按照以下步骤将这些警报路由到其他通知通道,例如 ITSM、Webhook、逻辑应用等。

  1. 在 Azure 门户中,转到“备份中心”。

  2. 选择菜单中的“警报”,然后选择“警报处理规则”。

    Screenshot for Manage Actions in Backup center.

  3. 选择创建

    Screenshot for creating a new action rule.

  4. 选择该警报处理规则的应用范围。

    可以针对订阅内的所有资源应用该规则。 还可以选择性地对警报应用筛选器,例如,仅针对特定严重性的警报生成通知。

    Screenshot for setting the action rule scope.

  5. 在“规则设置”下,创建一个操作组(或使用现有的操作组)。

    操作组是针对警报的通知应发送到的目标。 例如,一个电子邮件地址。

    Screenshot for creating a new action group.

  6. 在“基本信息”选项卡上,选择操作组的名称,以及要在其下创建该操作组的订阅和资源组。

    Screenshot for basic properties of action group.

  7. 在“通知”选项卡中选择“电子邮件/短信/推送/语音”并输入收件人电子邮件 ID。

    Screenshot for setting notification properties.

  8. 选择“查看+创建”->“创建”以部署操作组。

  9. 保存操作规则。

详细了解 Azure Monitor 中的操作规则

恢复服务保管库中的备份警报

重要

本部分介绍一种较旧的警报解决方案(称为经典警报)。 我们建议改用基于 Azure Monitor 的警报,因为它提供多种优势。 有关如何切换的详细信息,请参阅切换基于 Azure Monitor 的警报

警报主要是通知你采取相关操作的方案。 “备份警报”部分显示 Azure 备份服务生成的警报。 这些警报由服务定义,你无法自定义创建任何警报。

警报方案

以下方案由服务定义为可发出警报的方案:

  • 备份/还原失败
  • 备份成功,并显示针对 Microsoft Azure 恢复服务 (MARS) 代理的警告
  • 停止保护并删除数据
  • 保管库已禁用软删除功能
  • 数据库工作负载的备份类型不受支持
  • 用于数据库备份的工作负载扩展运行状况问题

来自各种 Azure 备份解决方案的警报

下面是来自 Azure 备份解决方案的警报:

  • Azure VM 备份
  • Azure 文件备份
  • Azure 工作负荷备份,例如 SQL 备份、SAP HANA 备份
  • Microsoft Azure 恢复服务 (MARS) 代理

注意

  • 此处不会显示 System Center Data Protection Manager (SC-DPM) 和 Microsoft Azure 备份服务器 (MABS) 中的警报。
  • 目前不会为 Azure 文件存储备份发送停止保护并删除数据的警报。
  • 仅当对保管库启用了软删除功能,才会生成“停止保护并删除数据”警报,也就是说,如果对保管库禁用了软删除功能,则会发送单个警报以通知你软删除功能已禁用。 后续删除任何项的备份数据都不会引发警报。

合并的警报

对于 Azure 工作负载备份解决方案(例如 SQL 和 SAP HANA),系统可能频繁生成日志备份(根据策略,最高可达每 15 分钟生成 1 次)。 因此,你可能会遇到日志备份频繁失败的情况(最高可达每 15 分钟失败一次)。 在这种情况下,如果每次失败都引发一次警报,最终用户将会不堪其扰。

因此,系统会在第一次失败时发送警报,以后由于同一根本原因而失败时则不会生成警报。 将在第一个警报中更新失败计数。 但如果你已停用警报,则下一次失败会触发另一警报,系统会将其视为该情况的第一个警报。 这是 Azure 备份针对 SQL 和 SAP HANA 备份执行警报合并的方式。

不合并按需备份作业。

未引发警报时生成异常

在一些例外情况下,失败时不会引发警报。 它们分别是:

  • 显式取消了正在运行的作业。
  • 作业失败,因为另一个备份作业正在进行中(无需采取任何操作,因为我们必须等待前一个作业完成)。
  • VM 备份作业失败,因为备份的 Azure VM 不再存在。
  • 合并的警报

之所以设计上述异常,是因为我们知道,这些操作的结果(主要是用户触发的操作)会立即在门户/PS/CLI 客户端中显示。 因此,你会立即了解相关情况,不需要通知。

警报类型

可以根据警报严重性定义三种类型的警报:

  • 关键:原则上,任何(计划的或用户触发的)备份或恢复失败都会导致生成警报并显示为“关键”警报。 还会针对破坏性操作(例如删除备份)生成警报。
  • 警告:如果备份操作成功但出现了几条警告,则会将这些警报列为“警告”警报。 “警告”警报目前仅适用于 Azure 备份代理备份。
  • 信息性:目前,Azure 备份服务不会生成任何信息性警报。

备份警报的通知

注意

只能通过 Azure 门户配置通知。 目前不支持 PS/CLI/REST API/Azure 资源管理器模板客户端。

一旦引发警报,你就会收到通知。 Azure 备份通过电子邮件提供内置通知机制。 可以指定在生成警报时接收通知的个人电子邮件地址或通讯组列表。 你还可以选择是要接收每个警报的通知,还是将这些警报分组成按小时摘要,然后接收通知。

Screenshot of the Recovery Services vault built-in email notification.

配置通知后,你会收到一封欢迎电子邮件或简介电子邮件。 由此可以确认,在引发警报时,Azure 备份可向这些地址发送电子邮件。

如果将频率设置为“每小时摘要”,然后引发了警报,但在一小时内解决了该警报,那么,后续的每小时摘要中不会包括该警报。

注意

  • 如果执行了破坏性操作(例如“停止保护并删除数据”),那么,即使未针对恢复服务保管库配置通知,也会引发警报,并向订阅所有者、管理员和共同管理员发送电子邮件。
  • 若要针对成功的作业配置通知,请使用 Log Analytics

停用警报

若要停用/解决某个活动警报,可以选择与要停用的警报相对应的列表项。 这将打开一个屏幕,其中会显示有关警报的详细信息,顶部有一个“停用”按钮。 选择此按钮会将警报的状态更改为“非活动”。 还可以通过右键单击与警报对应的列表项,然后选择“停用”来停用该警报。

Screenshot showing how to inactivate alerts via Backup center.

后续步骤

使用 Azure Monitor 监视 Azure 备份工作负荷