Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Заголовки таблиц

Метрика — отображаемое имя метрики, отображаемое в портал Azure.
Имя в Rest API — имя метрики, указанное в REST API.
Единица измерения — единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: Average, Minimum, Maximum, Total, Count.
Размеры - Измерения , доступные для метрики.
Интервалы - времениИнтервалы выборки метрики. Например, указывает, PT1M что выборка метрики выполняется каждую минуту, PT30M каждые 30 минут, PT1H каждый час и т. д.
Экспорт DS — можно ли экспортировать метрику в журналы Azure Monitor с помощью параметров диагностики. Сведения об экспорте метрик см. в статье Создание параметров диагностики в Azure Monitor.

Сведения о хранении метрик см. в статье Общие сведения о метриках Azure Monitor.

Категория Metric Имя в REST API Unit Агрегирование Измерения Интервалы времени Экспорт DS
Ресурс Процент использования памяти ЦП

Процент использования памяти экземпляром. Сведения об использовании поступают каждую минуту.
CpuMemoryUtilizationPercentage Процент Минимальный, Максимальный, Средний instanceId PT1M Да
Ресурс Процент использования ЦП

Процент использования ЦП на экземпляре. Сведения об использовании поступают каждую минуту.
CpuUtilizationPercentage Процент Минимальный, Максимальный, Средний instanceId PT1M Да
Ресурс Ошибки сбора данных в минуту

Количество событий сбора данных, отброшенных в минуту.
DataCollectionErrorsPerMinute Count Минимальный, Максимальный, Средний instanceId, reason, type PT1M Нет
Ресурс События сбора данных в минуту

Количество событий сбора данных, обрабатываемых в минуту.
DataCollectionEventsPerMinute Count Минимальный, Максимальный, Средний instanceId, type PT1M Нет
Ресурс Емкость развертывания

Количество экземпляров в развертывании.
DeploymentCapacity Count Минимальный, Максимальный, Средний instanceId, State PT1M Нет
Ресурс Использование диска

Процент использования диска в экземпляре. Сведения об использовании поступают каждую минуту.
DiskUtilization Процент Минимальный, Максимальный, Средний instanceId, disk PT1M Да
Ресурс Энергия GPU в джоулях

Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту.
GpuEnergyJoules Count Минимальный, Максимальный, Средний instanceId PT1M Нет
Ресурс Процент использования памяти GPU

Процент использования памяти GPU в экземпляре. Сведения об использовании поступают каждую минуту.
GpuMemoryUtilizationPercentage Процент Минимальный, Максимальный, Средний instanceId PT1M Да
Ресурс Процент использования GPU

Процент использования GPU на экземпляре. Сведения об использовании поступают каждую минуту.
GpuUtilizationPercentage Процент Минимальный, Максимальный, Средний instanceId PT1M Да
Трафик Задержка запроса P50

Средняя задержка запроса P50, агрегированная по всем значениям задержки запросов, собранным за выбранный период времени
RequestLatency_P50 Миллисекунды Среднее <Нет> PT1M Да
Трафик Задержка запроса P90

Средняя задержка запроса P90, агрегированная по всем значениям задержки запросов, собранным за выбранный период времени
RequestLatency_P90 Миллисекунды Среднее <Нет> PT1M Да
Трафик Задержка запроса P95

Средняя задержка запроса P95, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P95 Миллисекунды Среднее <Нет> PT1M Да
Трафик Задержка запроса P99

Средняя задержка запроса P99, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P99 Миллисекунды Среднее <Нет> PT1M Да
Трафик Количество запросов в минуту

Количество запросов, отправленных в сетевое развертывание в течение минуты
RequestsPerMinute Count Среднее envoy_response_code PT1M Нет