Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces.

Заголовки таблиц

Метрика — отображаемое имя метрики, отображаемое в портал Azure.
Имя в Rest API — имя метрики, указанное в REST API.
Единица измерения — единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: Average, Minimum, Maximum, Total, Count.
Размеры - Измерения , доступные для метрики.
Интервалы - времениИнтервалы выборки метрики. Например, указывает, PT1M что выборка метрики выполняется каждую минуту, PT30M каждые 30 минут, PT1H каждый час и т. д.
Экспорт DS — можно ли экспортировать метрику в журналы Azure Monitor с помощью параметров диагностики. Сведения об экспорте метрик см. в статье Создание параметров диагностики в Azure Monitor.

Сведения о хранении метрик см. в статье Общие сведения о метриках Azure Monitor.

Список поддерживаемых журналов см. в разделе Поддерживаемые категории журналов — Microsoft.MachineLearningServices/workspaces.

Категория Metric Имя в REST API Unit Агрегирование Измерения Интервалы времени Экспорт DS
Quota Активные ядра

Число активных ядер
Active Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Активные узлы

Число активных узлов. Это узлы, активно выполняющие задание.
Active Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Выполнить Cancel Requested Runs

Количество запусков, для которых была запрошена отмена для этой рабочей области. Счетчик обновляется при получении запроса на отмену выполнения.
Cancel Requested Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Cancelled Runs

Количество запусков, отмененных для этой рабочей области. Счетчик обновляется при успешной отмене выполнения.
Cancelled Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Завершенные запуски

Число выполнений, успешно завершенных для этой рабочей области. Значение счетчика обновляется после выполнения и сбора выходных данных.
Completed Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Ресурс CpuCapacityMillicores

Максимальная емкость узла ЦП в MilliCores. Емкость агрегируется за интервал длительностью 1 минута.
CpuCapacityMillicores Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс CpuMemoryCapacityMegabytes

Максимальный уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryCapacityMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс CpuMemoryUtilizationMegabytes

Уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс CpuMemoryUtilizationPercentage

Процент использования памяти для узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationPercentage Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс CpuUtilization

Процент использования на узле ЦП. Сведения об использовании поступают каждую минуту.
CpuUtilization Count Среднее, максимальное, минимальное, общее Scenario, runId, NodeId, ClusterName PT1M Да
Ресурс CpuUtilizationMillicores

Сведения об использовании узла ЦП в MilliCores. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationMillicores Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс CpuUtilizationPercentage

Процент использования узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationPercentage Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс DiskAvailMegabytes

Доступное дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskAvailMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс DiskReadMegabytes

Данные считываются с диска в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskReadMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс DiskUsedMegabytes

Используемое дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskUsedMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс DiskWriteMegabytes

Данные, записанные на диск, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskWriteMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Выполнить ошибки

Число ошибок запуска в этой рабочей области. Значение счетчика обновляется при возникновении ошибки в процессе выполнения.
Errors Count Total, Average, Minimum, Maximum, Count Scenario PT1M Да
Выполнить циклы выполнения со сбоем;

Количество запусков, завершившихся сбоем для этой рабочей области. Значение счетчика обновляется при сбое выполнения.
Failed Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Finalizing Runs

Число выполнений, вошедших в состояние завершения для этой рабочей области. Значение счетчика обновляется, как выполнение уже завершено, но сбор выходных данных еще выполняется.
Finalizing Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Ресурс GpuCapacityMilliGPUs

Максимальная емкость устройства GPU в милли-GPU. Емкость агрегируется за интервал длительностью 1 минута.
GpuCapacityMilliGPUs Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuEnergyJoules

Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту.
GpuEnergyJoules Count Среднее, максимальное, минимальное, общее Scenario, runId, rootRunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuMemoryCapacityMegabytes

Максимальный объем памяти для устройства GPU в мегабайтах. Объем памяти агрегируется каждую минуту.
GpuMemoryCapacityMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuMemoryUtilization

Процент использования памяти на узле GPU. Сведения об использовании поступают каждую минуту.
GpuMemoryUtilization Count Среднее, максимальное, минимальное, общее Scenario, runId, NodeId, DeviceId, ClusterName PT1M Да
Ресурс GpuMemoryUtilizationMegabytes

Использование памяти устройством GPU в мегабайтах. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuMemoryUtilizationPercentage

Процент использования памяти устройством GPU. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationPercentage Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuUtilization

Процент использования на узле GPU. Сведения об использовании поступают каждую минуту.
GpuUtilization Count Среднее, максимальное, минимальное, общее Scenario, runId, NodeId, DeviceId, ClusterName PT1M Да
Ресурс GpuUtilizationMilliGPUs

Использование устройства GPU в милли-GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationMilliGPUs Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс GpuUtilizationPercentage

Процент использования устройства GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationPercentage Count Среднее, максимальное, минимальное, общее RunId, InstanceId, DeviceId, ComputeName PT1M Да
Ресурс IBReceiveMegabytes

Данные сети, полученные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBReceiveMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName, DeviceId PT1M Да
Ресурс IBTransmitMegabytes

Данные сети, отправленные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBTransmitMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName, DeviceId PT1M Да
Quota Бездействующие ядра

Число бездействующих ядер
Idle Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Бездействующие узлы

Количество узлов в неактивном состоянии. Узлы в неактивном состоянии — это узлы, на которых не выполняются никакие задания, но они могут принимать новые задания.
Idle Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Освобождаемые ядра

Число освобождаемых ядер
Leaving Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Освобождаемые узлы

Число освобождаемых узлов. Освобождаемые узлы — это узлы, которые только что завершили обработку задания и переходят в неактивное состояние.
Leaving Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Моделирование Неудачные развертывания модели

Число развертываний моделей, завершившихся сбоем в этой рабочей области
Model Deploy Failed Count Total, Average, Minimum, Maximum, Count Scenario, StatusCode PT1M Да
Моделирование Начатые развертывания модели

Число развертываний моделей, запущенных в этой рабочей области
Model Deploy Started Count Total, Average, Minimum, Maximum, Count Scenario PT1M Да
Моделирование Успешные развертывания модели

Число развертываний моделей, завершившихся успешно в этой рабочей области
Model Deploy Succeeded Count Total, Average, Minimum, Maximum, Count Scenario PT1M Да
Моделирование Неудачные регистрации модели

Число неудачных регистраций моделей в этой рабочей области
Model Register Failed Count Total, Average, Minimum, Maximum, Count Scenario, StatusCode PT1M Да
Моделирование Успешные регистрации модели

Число регистраций моделей, завершившихся успешно в этой рабочей области
Model Register Succeeded Count Total, Average, Minimum, Maximum, Count Scenario PT1M Да
Ресурс NetworkInputMegabytes

Полученные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkInputMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName, DeviceId PT1M Да
Ресурс NetworkOutputMegabytes

Отправленные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkOutputMegabytes Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName, DeviceId PT1M Да
Выполнить Not Responding Runs

Число неотвечающих запусков для этой рабочей области. Значение счетчика обновляется, когда выполнение переходит в состояние "Не отвечает".
Not Responding Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Not Started Runs

Число запусков в состоянии "Не запущено" для этой рабочей области. Значение счетчика обновляется при получении запроса на создание выполнения, но сведения о выполнении еще не заполнены.
Not Started Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Quota Замещенные ядра

Количество замещенных ядер
Preempted Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Замещенные узлы

Количество замещенных узлов. Это узлы с низким приоритетом, взятые из пула доступных узлов.
Preempted Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Выполнить Preparing Runs

Число запусков, которые подготавливаются для этой рабочей области. Значение счетчиков обновляется, когда выполнение переходит в состояние подготовки во время подготовки среды выполнения.
Preparing Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Provisioning Runs

Число запусков, которые подготавливаются для этой рабочей области. Значение счетчика обновляется, когда запуск ожидает создания или подготовки целевого объекта вычислений.
Provisioning Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Queued Runs

Число запусков, которые находятся в очереди для этой рабочей области. Значение счетчика обновляется, когда запуск помещается в очередь целевого объекта вычислений. Может возникнуть при ожидании готовности требуемых вычислительных узлов.
Queued Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Quota Процент использования квоты

Процент использования квоты
Quota Utilization Percentage Count Среднее, максимальное, минимальное, общее Scenario, ClusterName, VmFamilyName, VmPriority PT1M Да
Выполнить Начатые запуски

Число запусков в этой рабочей области. Значение счетчика обновляется, когда запуск на требуемых ресурсах начинается.
Started Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Выполнить Starting Runs

Количество запусков, начавшихся для этой рабочей области. Значение счетчика обновляется после запроса на создание запуска и заполнения сведений о запуске, например идентификатора запуска
Starting Runs Count Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Да
Ресурс StorageAPIFailureCount

Число сбоев вызовов API Хранилища BLOB-объектов Azure.
StorageAPIFailureCount Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Ресурс StorageAPISuccessCount

Число успешных вызовов API Хранилища BLOB-объектов Azure.
StorageAPISuccessCount Count Среднее, максимальное, минимальное, общее RunId, InstanceId, ComputeName PT1M Да
Quota Всего ядер

Общее число ядер
Total Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Всего узлов

Общее число узлов. Сюда входят некоторые активные узлы, бездействующие узлы, неиспользуемые узлы, замещенные узлы и освобождаемые узлы
Total Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Недоступные для использования ядра

Число ядер, непригодных для использования
Unusable Cores Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Quota Недоступные для использования узлы

Число узлов, непригодных для использования. Узлы, непригодные для использования, не работают из-за неразрешимой проблемы. Azure выполнит повторный запуск этих узлов.
Unusable Nodes Count Среднее, максимальное, минимальное, общее Scenario, ClusterName PT1M Да
Выполнить Предупреждения

Число предупреждений запуска в этой рабочей области. Значение счетчика обновляется каждый раз, когда для запуска возникает предупреждение.
Warnings Count Total, Average, Minimum, Maximum, Count Scenario PT1M Да