使用 Azure Monitor 警报响应 Azure Stack HCI 运行状况警报

适用于:Azure Stack HCI 版本 23H2

本文介绍如何使用 Azure Monitor 警报 主动识别、通知和响应 Azure Stack HCI 运行状况警报。

关于 Azure Monitor 和 Azure Stack HCI 警报的集成

Azure Monitor 警报与 Azure Stack HCI 的集成增强了 Azure Stack HCI 的运行状况警报功能。 通过此集成,本地 Azure Stack HCI 系统内生成的任何运行状况警报都会自动转发到 Azure Monitor 警报。 可以将这些警报与自动化事件管理系统相关联,确保及时高效的响应。

有关 Azure Monitor 警报的详细信息,请参阅 什么是 Azure Monitor 警报?

好处

将 Azure Monitor 警报与 Azure Stack HCI 集成可提供以下几个关键优势:

  • 没有任何额外费用。 启用运行状况警报功能后,无需额外付费即可自动获取所有 Azure Stack HCI 群集运行状况问题的 Azure Monitor 警报。 无需设置 Log Analytics 或手动创作任何警报规则。

  • 准实时监视。 借助提供准实时监视的 Azure Stack HCI 运行状况警报,可以在问题发生时检测问题并立即采取措施,从而减少停机时间。

  • 可定制性。 Azure Stack HCI 运行状况警报体验基于 Azure Monitor 警报构建。 可以配置警报处理规则,以便通过首选 事件管理合作伙伴通知正确的团队,确保快速有效地响应问题。

先决条件

下面是将运行状况警报与 Azure Stack HCI 配合使用的先决条件:

为 Azure Stack HCI 配置运行状况警报

下面是为 Azure Stack HCI 配置运行状况警报的高级步骤:

  • 步骤 1: 打开运行状况警报功能。
  • 步骤 2: 配置警报处理规则。

步骤 1:启用运行状况警报功能

通过Azure 门户启用警报时,会在后台安装 Azure Monitor 扩展。 若要验证是否已安装此扩展,请转到Azure 门户中的“设置>扩展”。 此扩展在扩展列表中显示为 AzureEdgeAlerts

按照以下步骤通过Azure 门户启用运行状况警报。

  1. 转到 Azure Stack HCI 群集资源页并选择群集。 在“ 功能 ”选项卡下,选择“ 运行状况警报 ”磁贴。

    Azure Stack HCI 群集资源页的屏幕截图,其中选择了群集和“运行状况警报”磁贴。

  2. 在右侧的“ 打开运行状况警报 ”窗格中,选择“ 打开 ”按钮。

    右侧的“运行状况警报”窗格的屏幕截图,其中选择了“打开”按钮。

    Azure Monitor 警报扩展的安装在后台开始。

  3. 成功安装扩展后,将导航到“功能”选项卡。验证“功能”选项卡下的“运行状况警报”磁贴现在是否显示为“已配置”。

    “功能”选项卡的屏幕截图,其中“运行状况警报”磁贴显示为“已配置”。

步骤 2:配置警报处理规则

在此步骤中,将配置警报处理规则,其中包含一系列配置和操作,以确定如何处理传入的警报。 通过这些规则,可以添加或禁止操作组、应用筛选器或指定预定义的计划来应用规则。

下面是有关如何配置警报处理规则以处理 Azure Stack HCI 运行状况警报的一些常见用例:

  • 配置操作组以确定接收通知的人员以及要发送的通知类型。 可以通过电子邮件和/或短信发送通知。
  • 指定与存储相关的运行状况故障的所有警报都应定向到负责解决存储问题的团队。
  • 配置何时应用规则。 默认情况下,该规则始终处于活动状态。 你可以将其设置为在特定时间工作,也可以设置定期计划。

有关警报处理规则以及如何配置它们的信息,请参阅 警报处理规则配置警报处理规则

查看运行状况警报

在Azure 门户中,可以从“监视>警报”边栏选项卡实时查看 Azure Stack HCI 群集上的运行状况警报

警报” 边栏选项卡具有每个严重性级别的警报的高级摘要。 可以向下钻取以查看每个严重性级别的各个警报。

每个严重级别警报的高级摘要的屏幕截图。

禁用运行状况警报

若要禁用运行状况警报功能,请卸载之前安装的 Azure Monitor 警报扩展。

有关说明,请参阅从Azure 门户卸载扩展

后续步骤

查看可能在 Azure Stack HCI 系统中运行的运行状况警报列表