Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标

下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。

表标题

指标 - 在Azure 门户中显示的指标显示名称。
Rest API 中的名称 - REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认 聚合 类型。 有效值:Average、Minimum、Maximum、Total、Count。
尺寸 - 可用于指标的维度
时间粒度 - 指标采样的间隔。 例如, PT1M 指示每分钟、每 30 分钟、 PT30MPT1H 每小时等对指标进行采样。
DS 导出 - 指标是否可通过诊断设置导出到 Azure Monitor 日志。 有关导出指标的信息,请参阅 在 Azure Monitor 中创建诊断设置

有关指标保留期的信息,请参阅 Azure Monitor 指标概述

类别 指标 REST API 中的名称 计价单位 聚合 维度 时间粒度 DS 导出
资源 CPU 内存利用率百分比

实例上的内存利用率百分比。 利用率每分钟报告一次。
CpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 CPU 使用率百分比

实例上的 CPU 利用率百分比。 利用率每分钟报告一次。
CpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 每分钟数据收集错误数

每分钟删除的数据收集事件数。
DataCollectionErrorsPerMinute 计数 最小值、最大值、平均值 instanceId, reason, type PT1M
资源 每分钟数据收集事件数

每分钟处理的数据收集事件数。
DataCollectionEventsPerMinute 计数 最小值、最大值、平均值 instanceId, type PT1M
资源 部署容量

部署中的实例数。
DeploymentCapacity 计数 最小值、最大值、平均值 instanceId, State PT1M
资源 磁盘利用率

实例上的磁盘利用率百分比。 利用率每分钟报告一次。
DiskUtilization 百分比 最小值、最大值、平均值 instanceId, disk PT1M
资源 GPU 能量(以焦耳为单位)

GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。
GpuEnergyJoules 计数 最小值、最大值、平均值 instanceId PT1M
资源 GPU 内存利用率百分比

实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。
GpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 GPU 利用率百分比

实例上的 GPU 利用率百分比。 利用率每分钟报告一次。
GpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
交通 P50 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟
RequestLatency_P50 毫秒 平均值 <无> PT1M
交通 P90 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟
RequestLatency_P90 毫秒 平均值 <无> PT1M
交通 P95 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟
RequestLatency_P95 毫秒 平均值 <无> PT1M
交通 P99 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟
RequestLatency_P99 毫秒 平均值 <无> PT1M
交通 每分钟请求数

一分钟内发送到联机部署的请求数
RequestsPerMinute 计数 平均值 envoy_response_code PT1M