Share via


Microsoft.MachineLearningServices/workspaces에 대해 지원되는 메트릭

다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

테이블 머리글

메트릭 - Azure Portal 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 유형입니다. 유효한 값: 평균, 최소, 최대, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어 PT1M 은 메트릭이 1분마다, PT30M 30분마다, PT1H 매시간 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다. 메트릭을 내보내는 방법에 대한 자세한 내용은 Azure Monitor에서 진단 설정 만들기를 참조하세요.

메트릭 보존에 대한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조하세요.

범주 메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
할당량 활성 코어

활성 코어 수
Active Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 활성 노드

활성 노드 수. 작업을 능동적으로 실행 중인 노드입니다.
Active Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
실행 취소가 요청된 실행

이 작업 영역에 대해 취소가 요청된 실행 수. 실행 취소 요청이 수신되면 개수가 업데이트됩니다.
Cancel Requested Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 취소된 실행

이 작업 영역에 대해 취소된 실행 수. 실행이 성공적으로 취소되면 수가 업데이트됩니다.
Cancelled Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 완료된 실행

이 작업 영역에 대해 성공적으로 완료된 실행 수. 실행이 완료되고 출력이 수집되면 개수가 업데이트됩니다.
Completed Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
리소스 CpuCapacityMillicores

CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다.
CpuCapacityMillicores 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 CpuMemoryCapacityMegabytes

CPU 노드의 최대 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
CpuMemoryCapacityMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 CpuMemoryUtilizationMegabytes

CPU 노드의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 CpuMemoryUtilizationPercentage

CPU 노드의 메모리 사용률(%). 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationPercentage 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 CpuUtilization

CPU 노드의 사용률(백분율). 사용률은 1분 간격으로 보고됩니다.
CpuUtilization 개수 평균, 최대, 최소, 합계 Scenario, runId, NodeId, ClusterName PT1M Yes
리소스 CpuUtilizationMillicores

CPU 노드의 사용률(밀리코어). 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationMillicores 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 CpuUtilizationPercentage

CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationPercentage 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 DiskAvailMegabytes

사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskAvailMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 DiskReadMegabytes

디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskReadMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 DiskUsedMegabytes

사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskUsedMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 DiskWriteMegabytes

디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskWriteMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
실행 Errors

이 작업 영역의 실행 오류 수. 실행에서 오류가 발생할 때마다 개수가 업데이트됩니다.
Errors 개수 Total, Average, Minimum, Maximum, Count Scenario PT1M Yes
실행 실패한 실행

이 작업 영역에 대해 실패한 실행 수. 실행이 실패하면 개수가 업데이트됩니다.
Failed Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 완료 중인 실행

이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 수집이 아직 진행 중일 때 개수가 업데이트됩니다.
Finalizing Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
리소스 GpuCapacityMilliGPUs

GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다.
GpuCapacityMilliGPUs 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuEnergyJoules

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules 개수 평균, 최대, 최소, 합계 Scenario, runId, rootRunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuMemoryCapacityMegabytes

GPU 디바이스의 최대 메모리 용량(MB). 용량은 1분 간격으로 집계됩니다.
GpuMemoryCapacityMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuMemoryUtilization

GPU 노드의 메모리 사용률(백분율). 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilization 개수 평균, 최대, 최소, 합계 Scenario, runId, NodeId, DeviceId, ClusterName PT1M Yes
리소스 GpuMemoryUtilizationMegabytes

GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuMemoryUtilizationPercentage

GPU 디바이스의 메모리 사용률(%). 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationPercentage 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuUtilization

GPU 노드의 사용률(백분율). 사용률은 1분 간격으로 보고됩니다.
GpuUtilization 개수 평균, 최대, 최소, 합계 Scenario, runId, NodeId, DeviceId, ClusterName PT1M Yes
리소스 GpuUtilizationMilliGPUs

GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationMilliGPUs 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 GpuUtilizationPercentage

GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationPercentage 개수 평균, 최대, 최소, 합계 RunId, InstanceId, DeviceId, ComputeName PT1M Yes
리소스 IBReceiveMegabytes

InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBReceiveMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName, DeviceId PT1M Yes
리소스 IBTransmitMegabytes

InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBTransmitMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName, DeviceId PT1M Yes
할당량 유휴 코어

유휴 코어 수
Idle Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 유휴 노드

유휴 노드 수. 유휴 노드는 현재 작업을 실행하고 있지 않지만 새 작업이 있으면 수락할 수 있는 노드입니다.
Idle Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 나가는 코어

나가는 코어 수
Leaving Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 나가는 노드

나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다.
Leaving Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
모델 모델 배포 실패

이 작업 영역에서 실패한 모델 배포 수
Model Deploy Failed 개수 Total, Average, Minimum, Maximum, Count Scenario, StatusCode PT1M Yes
모델 모델 배포 시작

이 작업 영역에서 시작한 모델 배포 수
Model Deploy Started 개수 Total, Average, Minimum, Maximum, Count Scenario PT1M Yes
모델 모델 배포 성공

이 작업 영역에서 성공한 모델 배포 수
Model Deploy Succeeded 개수 Total, Average, Minimum, Maximum, Count Scenario PT1M Yes
모델 모델 레지스터 실패

이 작업 영역에서 실패한 모델 등록 수
Model Register Failed 개수 Total, Average, Minimum, Maximum, Count Scenario, StatusCode PT1M Yes
모델 모델 레지스터 성공

이 작업 영역에서 성공한 모델 등록 수
Model Register Succeeded 개수 Total, Average, Minimum, Maximum, Count Scenario PT1M Yes
리소스 NetworkInputMegabytes

수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
NetworkInputMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName, DeviceId PT1M Yes
리소스 NetworkOutputMegabytes

발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
NetworkOutputMegabytes 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName, DeviceId PT1M Yes
실행 응답 없는 실행

이 작업 영역에 대해 응답하지 않는 실행 수. 실행이 응답 없음 상태로 전환될 때 개수가 업데이트됩니다.
Not Responding Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 시작되지 않은 실행

이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 개수가 업데이트됩니다.
Not Started Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
할당량 선점된 코어

선점된 코어 수
Preempted Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 선점된 노드

선점된 노드 수. 사용 가능한 노드 풀에서 가져온 낮은 우선 순위 노드입니다.
Preempted Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
실행 준비 중인 실행

이 작업 영역에 대해 준비 중인 실행 수. 실행 환경을 준비하는 동안 실행이 준비 중인 상태에 진입하면 개수가 업데이트됩니다.
Preparing Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 프로비저닝 중인 실행

이 작업 영역에 대해 프로비저닝 중인 실행 수. 실행이 컴퓨팅 대상 생성 또는 프로비저닝을 기다릴 때 개수가 업데이트됩니다.
Provisioning Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 큐에서 대기 중인 실행

이 작업 영역에 대해 큐에서 대기 중인 실행 수. 실행이 컴퓨팅 대상의 큐에서 대기할 때 수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기하는 동안 발생할 수 있습니다.
Queued Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
할당량 할당량 사용률

사용한 할당량 백분율
Quota Utilization Percentage 개수 평균, 최대, 최소, 합계 Scenario, ClusterName, VmFamilyName, VmPriority PT1M Yes
실행 실행 시작

이 작업 영역에 대해 실행 중인 실행 수. 실행이 필요한 리소스에서 실행되기 시작할 때 개수가 업데이트됩니다.
Started Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
실행 시작 중인 실행

이 작업 영역에 대해 시작된 실행 수. 실행 및 실행 정보(예: 실행 ID)를 만드는 요청이 채워지면 수가 업데이트됩니다.
Starting Runs 개수 Total, Average, Minimum, Maximum, Count Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
리소스 StorageAPIFailureCount

Azure Blob Storage API 호출 실패 횟수
StorageAPIFailureCount 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
리소스 StorageAPISuccessCount

Azure Blob Storage API 호출 성공 횟수
StorageAPISuccessCount 개수 평균, 최대, 최소, 합계 RunId, InstanceId, ComputeName PT1M Yes
할당량 총 코어 수

총 코어 수
Total Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 총 노드 수

총 노드 수. 이 합계에는 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 나가는 노드 중 일부가 포함됩니다.
Total Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 사용 불가 코어

사용할 수 없는 코어 수
Unusable Cores 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
할당량 사용 불가 노드

사용할 수 없는 노드 수. 사용할 수 없는 노드는 확인할 수 없는 문제 때문에 작동하지 않는 노드입니다. Azure에서는 이러한 노드를 재활용합니다.
Unusable Nodes 개수 평균, 최대, 최소, 합계 Scenario, ClusterName PT1M Yes
실행 경고

이 작업 영역의 실행 경고 수. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다.
Warnings 개수 Total, Average, Minimum, Maximum, Count Scenario PT1M