使用 Azure Monitor 指标监视 Azure Stack HCI

适用于:Azure Stack HCI 版本 23H2

本文介绍如何使用 Azure Monitor 指标监视 Azure Stack HCI 群集。 它还提供了为 Azure Stack HCI 中的计算、存储和网络资源收集的指标的完整列表。

如果你有依赖 Azure 资源的关键应用程序和业务流程,则需要监视这些资源的可用性、性能和操作。 将 Azure Monitor 指标与 Azure Stack HCI 集成后,可以将群集中的数值数据存储在专用时序数据库中。 系统会自动为每个 Azure 订阅创建此数据库。 使用 指标资源管理器 分析 Azure Stack HCI 系统中的数据,并评估其运行状况和利用率。

花点时间watch有关在指标资源管理器中创建指标图表和使用指标的警报的视频演练:

好处

下面是使用 Azure Stack HCI 指标的好处:

  • 无额外费用。 这些指标是标准的开箱即用功能,会自动收集并提供给你,无需额外付费。

  • 准实时见解。 你能够观察现成的指标,并使用准实时数据关联趋势。  

  • 自定义。 可以创建自己的图形,并通过聚合和筛选功能自定义它们。 通过 Excel、工作簿保存和共享指标图表或将其发送到 Grafana 的任务非常简单。

  • 自定义警报规则。 可以在指标上编写自定义警报规则,以有效监视 Azure Stack HCI 群集的运行状况。

先决条件

下面是使用 Azure Stack HCI 指标的先决条件:

  • 必须有权访问运行 Azure Stack HCI 版本 23H2 (内部版本 2311) 或更高版本的群集。 群集必须部署并在 Azure 中注册。

  • 必须安装该AzureEdgeTelemetryAndDiagnostics扩展才能从 Azure Stack HCI 系统收集遥测和诊断信息。 有关扩展的详细信息,请参阅 Azure Stack HCI 遥测和诊断扩展概述

通过“监视”选项卡监视 Azure Stack HCI

在Azure 门户,可以通过导航到群集的“概述”页上的“监视”选项卡来监视群集的平台指标。 此选项卡提供了查看不同平台指标的图形的快速方法。 可以选择任何图形以在指标资源管理器中进一步分析数据。

按照以下步骤在Azure 门户中监视群集的平台指标:

  1. 转到 Azure Stack HCI 群集资源页并选择群集。

  2. 在群集的“ 概述 ”页上,选择“ 监视 ”选项卡。

    显示群集的“监视”选项卡的屏幕截图。

  3. 在“ 平台指标 ”窗格中,查看显示平台指标的图。 若要了解 Azure Monitor 为填充这些关系图而收集的指标,请参阅 “监视”选项卡图的指标

    • 在窗格顶部,选择持续时间以更改图形的时间范围。

    • 选择“ 查看所有指标” 链接以使用指标资源管理器分析指标。 请参阅 分析指标

    • 选择任意图形以在指标资源管理器中打开它们,以进一步向下钻取或创建警报规则。 请参阅Create指标警报

      显示群集的平台指标的屏幕截图。

分析指标

可以使用 指标资源管理器 以交互方式分析指标数据库中的数据,并绘制多个指标随时间推移的值图表。 若要在Azure 门户中打开指标资源管理器,请选择“监视”部分下的“指标”。

显示“选择范围”窗格的屏幕截图。

还可以直接从 Azure Stack HCI 服务的菜单访问 指标

“指标”页的屏幕截图。

使用 指标,可以根据指标值创建图表,并直观地关联趋势。 还可以创建指标警报规则或将图表固定到 Azure 仪表板,以便通过其他可视化效果查看它们。 有关使用此工具的教程,请参阅分析 Azure 资源的指标

平台指标存储 93 天,但是,你只能在“ 指标 ”磁贴) 查询任何单个图表上最多 30 天的数据 (。 若要详细了解数据保留,请参阅 Azure Monitor 中的指标

分析特定群集的指标

按照以下步骤分析Azure 门户中特定 Azure Stack HCI 群集的指标:

  1. 转到 Azure Stack HCI 群集并导航到 “监视 ”部分。

  2. 若要分析指标,请选择“ 指标 ”选项。 群集已在范围部分中填充。 选择要分析的指标。

    显示群集指标的屏幕截图。

    若要创建警报,请选择“警报”选项,并按照Create指标警报中所述设置警报。

收集哪些指标?

本部分列出了为 Azure Stack HCI 群集收集的平台指标、聚合类型和可用于每个指标的维度。 有关指标维度的详细信息,请参阅多维指标

“监视”选项卡图的指标

下表列出了 Azure Monitor 为填充“ 监视 ”选项卡上的图形而收集的指标:

指标 计价单位
CPU 百分比 百分比
网络传入/秒 每秒字节数
网络输出/秒 每秒字节数
磁盘读取(字节/秒) 每秒字节数
磁盘写入(字节/秒) 每秒字节数
磁盘读取操作次数/秒 每秒计数
磁盘写入操作次数/秒 每秒计数
已用内存字节数 字节

服务器的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
CPU 百分比 非空闲处理器时间的百分比。 百分比 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName
CPU 来宾百分比 用于来宾(虚拟机)需求的处理器时间百分比。 百分比 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName
CPU 主机百分比 用于主机要求的处理器时间百分比。 百分比 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName
群集节点内存总计 服务器的总物理内存。 字节 Sum 最小值、最大值、平均值 ClusterName、HostName
群集节点可用内存 服务器的可用内存。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName
已用群集节点内存 服务器的已用内存。 字节 最大值 最小值、最大值 ClusterName、HostName
内存百分比 服务器的已分配(不可用)内存。 百分比 最大值 最小值、最大值、总和、计数 ClusterName、HostName
内存来宾百分比 分配给来宾(虚拟机)需求的内存。 百分比 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN、VM
内存主机百分比 分配给主机需求的内存。 百分比 最大值 最小值、最大值、总和、计数 ClusterName、HostName
群集节点 Csv 缓存读取命中 缓存命中 PerSecond 进行读取操作。 每秒计数 最大值 最小值、最大值、总和、计数 ClusterName、HostName、LUN
群集节点 Csv 缓存读取命中率 读取操作的缓存命中率。 百分比 最大值 最小值、最大值、总和、计数 ClusterName、HostName、LUN
群集节点 Csv 缓存读取未命中 缓存 missPerSecond 以便执行读取操作。 每秒计数 最大值 最小值、最大值、总和、计数 ClusterName、HostName、LUN
群集节点存储降级 存储池中发生故障或丢失的驱动器总数。 字节 Sum 最小值、最大值、总和、计数 ClusterName、HostName

驱动器的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
物理磁盘读取操作数/秒 驱动器每秒完成的读取操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘写入操作数/秒 驱动器每秒完成的写入操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘读取和写入操作数/秒 驱动器每秒完成的读取或写入操作总数。 每秒计数 Sum 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘读取字节数/秒 每秒从驱动器读取的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘写入字节数/秒 每秒写入驱动器的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘读取和写入 每秒从驱动器读取或写入驱动器的数据总量。 每秒字节数 Sum 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
物理磁盘延迟读取 从驱动器读取操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、LUN
物理磁盘延迟写入 对驱动器执行写操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、LUN
物理磁盘延迟平均值 与驱动器之间的所有操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、LUN
物理磁盘容量大小总计 驱动器的总存储容量。 字节 Sum 最小值、最大值、平均值 ClusterName、HostName、LUN
使用的物理磁盘容量大小 驱动器的已用存储容量。 字节 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN

网络适配器的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
网络 In/sec 网络适配器接收数据的速率。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、网络适配器、LUN
网络输出/秒 网络适配器发送数据的速率。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、网络适配器、LUN
网络总计/秒 网络适配器接收或发送数据的总速率。 每秒字节数 Sum 最小值、最大值、平均值、总和、计数 ClusterName、HostName、网络适配器、LUN
Netadapter 带宽 Rdma 入站 网络适配器通过 RDMA 接收数据的速率。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、网络适配器、LUN
Netadapter 带宽 Rdma 出站 网络适配器通过 RDMA 发送数据的速率。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、网络适配器、LUN
Netadapter Bandwidth Rdma Total 网络适配器通过 RDMA 接收或发送数据的总速率。 每秒字节数 Sum 最小值、最大值、总和、计数 ClusterName、HostName、网络适配器、LUN

VHD 的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
VHD 读取操作数/秒 虚拟硬盘每秒完成的读取操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、VHD
VHD 写入操作数/秒 虚拟硬盘每秒完成的写入操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、VHD
VHD 读取和写入操作数/秒 虚拟硬盘每秒完成的读取或写入操作总数。 每秒计数 Sum 最小值、最大值、总和、计数 ClusterName、HostName、VHD
VHD 读取字节数/秒 每秒从虚拟硬盘读取的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、VHD
VHD 写入字节数/秒 每秒写入虚拟硬盘的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、VHD
VHD 读取和写入字节数/秒 每秒从虚拟硬盘读取或写入虚拟硬盘的数据总量。 每秒字节数 Sum 最小值、最大值、总和、计数 ClusterName、HostName、VHD
VHD 平均延迟 与虚拟硬盘之间的所有操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、VHD
当前 VHD 大小 动态扩展下虚拟硬盘的当前文件大小。 如果已修复,则不会收集序列。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、Instance
VHD 最大大小 动态扩展下虚拟硬盘的最大大小。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、VHD

VM 的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
VM CPU 百分比 虚拟机使用其主机服务器的处理器 () 的百分比。 百分比 最大值 最小值、最大值、总和、计数 ClusterName、主机名、VM
分配的 VM 内存 分配给虚拟机的内存量。 字节 Sum 最小值、最大值 ClusterName、HostName、LUN、VM
VM 内存可用 分配的内存量中仍然可用的内存量。 字节 最大值 最小值、最大值、总和、计数 ClusterName、HostName、VM、LUN
使用的 VM 内存 使用的 VM 内存 字节 最大值 最小值、最大值 ClusterName、HostName、VM、LUN
VM 内存最大值 如果使用动态内存,则这是可能分配给虚拟机的最大内存量。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、LUN、VM
VM 内存最小值 如果使用动态内存,则这是可能分配给虚拟机的最小内存量。 字节 最小值 最小值、最大值、平均值 ClusterName、HostName、LUN、VM
VM 内存压力 虚拟机所需的内存与分配给虚拟机的内存的比率。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、LUN、VM
VM 内存启动 启动虚拟机所需的内存量。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、LUN、VM
VM 内存总计 内存总量。 字节 最大值 最小值、最大值、平均值 ClusterName、HostName、VM、LUN
VM 网络适配器网络 In/sec 虚拟机在其所有虚拟网络适配器上接收的数据比率。 每秒位数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName 虚拟网络 适配器
VM 网络适配器网络输出/秒 虚拟机在其所有虚拟网络适配器上发送的数据比率。 每秒位数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName 虚拟网络 适配器
VM 网络适配器网络传入和传出/秒 虚拟机在其所有虚拟网络适配器上接收或发送的数据总比率。 每秒位数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName 虚拟网络 适配器

卷的指标

指标 说明 计价单位 默认聚合类型 支持的聚合类型 维度
磁盘读取操作次数/秒 此卷每秒完成的读取操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
磁盘写入操作次数/秒 此卷每秒完成的写入操作数。 每秒计数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
磁盘读取和写入操作数/秒 此卷每秒完成的读取或写入操作的总数。 每秒计数 Sum 最小值、最大值、总和、计数 ClusterName、HostName、LUN
磁盘读取(字节/秒) 每秒从此卷读取的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
磁盘写入(字节/秒) 每秒写入到此卷的数据量。 每秒字节数 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN
磁盘读取和写入 每秒从此卷读取的和写入到此卷的数据总量。 每秒字节数 Sum 最小值、最大值、总和、计数 ClusterName、HostName、LUN
卷延迟读取 从此卷进行的读取操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、LUN
卷延迟写入 对此卷进行的写入操作的平均延迟。 最大值 最小值、最大值、平均值、总和 ClusterName、HostName、LUN
卷延迟平均值 向此卷进行的或从此卷进行的所有操作的平均延迟。 最大值 最小值、最大值、总和 ClusterName、HostName、LUN
卷大小总计 卷的总存储容量。 字节 Sum 最小值、最大值、平均值 ClusterName、HostName、LUN
卷大小可用 卷的可用存储容量。 字节 最大值 最小值、最大值、平均值、总和、计数 ClusterName、HostName、LUN

若要查看有关如何收集这些指标的深入信息,请参阅存储空间直通的性能历史记录

后续步骤