Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标
下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。
表标题
指标 - 在Azure 门户中显示的指标显示名称。
Rest API 中的名称 - REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认 聚合 类型。 有效值:Average、Minimum、Maximum、Total、Count。
尺寸 - 可用于指标的维度。
时间粒度 - 指标采样的间隔。 例如, PT1M
指示每分钟、每 30 分钟、 PT30M
PT1H
每小时等对指标进行采样。
DS 导出 - 指标是否可通过诊断设置导出到 Azure Monitor 日志。 有关导出指标的信息,请参阅 在 Azure Monitor 中创建诊断设置。
有关指标保留期的信息,请参阅 Azure Monitor 指标概述。
类别 | 指标 | REST API 中的名称 | 计价单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|---|
资源 | CPU 内存利用率百分比 实例上的内存利用率百分比。 利用率每分钟报告一次。 |
CpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | CPU 使用率百分比 实例上的 CPU 利用率百分比。 利用率每分钟报告一次。 |
CpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | 每分钟数据收集错误数 每分钟删除的数据收集事件数。 |
DataCollectionErrorsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId , reason , type |
PT1M | 否 |
资源 | 每分钟数据收集事件数 每分钟处理的数据收集事件数。 |
DataCollectionEventsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId , type |
PT1M | 否 |
资源 | 部署容量 部署中的实例数。 |
DeploymentCapacity |
计数 | 最小值、最大值、平均值 | instanceId , State |
PT1M | 否 |
资源 | 磁盘利用率 实例上的磁盘利用率百分比。 利用率每分钟报告一次。 |
DiskUtilization |
百分比 | 最小值、最大值、平均值 | instanceId , disk |
PT1M | 是 |
资源 | GPU 能量(以焦耳为单位) GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。 |
GpuEnergyJoules |
计数 | 最小值、最大值、平均值 | instanceId |
PT1M | 否 |
资源 | GPU 内存利用率百分比 实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。 |
GpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | GPU 利用率百分比 实例上的 GPU 利用率百分比。 利用率每分钟报告一次。 |
GpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
交通 | P50 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟 |
RequestLatency_P50 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P90 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟 |
RequestLatency_P90 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P95 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟 |
RequestLatency_P95 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P99 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟 |
RequestLatency_P99 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | 每分钟请求数 一分钟内发送到联机部署的请求数 |
RequestsPerMinute |
计数 | 平均值 | envoy_response_code |
PT1M | 否 |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈