Microsoft.MachineLearningServices/workspaces에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
테이블 머리글
메트릭 - Azure Portal 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 유형입니다. 유효한 값: 평균, 최소, 최대, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어 PT1M
은 메트릭이 1분마다, PT30M
30분마다, PT1H
매시간 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다. 메트릭을 내보내는 방법에 대한 자세한 내용은 Azure Monitor에서 진단 설정 만들기를 참조하세요.
메트릭 보존에 대한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조하세요.
범주 | 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|---|
할당량 | 활성 코어 활성 코어 수 |
Active Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 활성 노드 활성 노드 수. 작업을 능동적으로 실행 중인 노드입니다. |
Active Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
실행 | 취소가 요청된 실행 이 작업 영역에 대해 취소가 요청된 실행 수. 실행 취소 요청이 수신되면 개수가 업데이트됩니다. |
Cancel Requested Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 취소된 실행 이 작업 영역에 대해 취소된 실행 수. 실행이 성공적으로 취소되면 수가 업데이트됩니다. |
Cancelled Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 완료된 실행 이 작업 영역에 대해 성공적으로 완료된 실행 수. 실행이 완료되고 출력이 수집되면 개수가 업데이트됩니다. |
Completed Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
리소스 | CpuCapacityMillicores CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다. |
CpuCapacityMillicores |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | CpuMemoryCapacityMegabytes CPU 노드의 최대 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | CpuMemoryUtilizationMegabytes CPU 노드의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | CpuMemoryUtilizationPercentage CPU 노드의 메모리 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | CpuUtilization CPU 노드의 사용률(백분율). 사용률은 1분 간격으로 보고됩니다. |
CpuUtilization |
개수 | 평균, 최대, 최소, 합계 | Scenario , runId , NodeId , ClusterName |
PT1M | Yes |
리소스 | CpuUtilizationMillicores CPU 노드의 사용률(밀리코어). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationMillicores |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | CpuUtilizationPercentage CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | DiskAvailMegabytes 사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskAvailMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | DiskReadMegabytes 디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskReadMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | DiskUsedMegabytes 사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskUsedMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | DiskWriteMegabytes 디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskWriteMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
실행 | Errors 이 작업 영역의 실행 오류 수. 실행에서 오류가 발생할 때마다 개수가 업데이트됩니다. |
Errors |
개수 | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Yes |
실행 | 실패한 실행 이 작업 영역에 대해 실패한 실행 수. 실행이 실패하면 개수가 업데이트됩니다. |
Failed Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 완료 중인 실행 이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 수집이 아직 진행 중일 때 개수가 업데이트됩니다. |
Finalizing Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
리소스 | GpuCapacityMilliGPUs GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다. |
GpuCapacityMilliGPUs |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuEnergyJoules GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
개수 | 평균, 최대, 최소, 합계 | Scenario , runId , rootRunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuMemoryCapacityMegabytes GPU 디바이스의 최대 메모리 용량(MB). 용량은 1분 간격으로 집계됩니다. |
GpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuMemoryUtilization GPU 노드의 메모리 사용률(백분율). 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilization |
개수 | 평균, 최대, 최소, 합계 | Scenario , runId , NodeId , DeviceId , ClusterName |
PT1M | Yes |
리소스 | GpuMemoryUtilizationMegabytes GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuMemoryUtilizationPercentage GPU 디바이스의 메모리 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuUtilization GPU 노드의 사용률(백분율). 사용률은 1분 간격으로 보고됩니다. |
GpuUtilization |
개수 | 평균, 최대, 최소, 합계 | Scenario , runId , NodeId , DeviceId , ClusterName |
PT1M | Yes |
리소스 | GpuUtilizationMilliGPUs GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationMilliGPUs |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | GpuUtilizationPercentage GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Yes |
리소스 | IBReceiveMegabytes InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBReceiveMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Yes |
리소스 | IBTransmitMegabytes InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBTransmitMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Yes |
할당량 | 유휴 코어 유휴 코어 수 |
Idle Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 유휴 노드 유휴 노드 수. 유휴 노드는 현재 작업을 실행하고 있지 않지만 새 작업이 있으면 수락할 수 있는 노드입니다. |
Idle Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 나가는 코어 나가는 코어 수 |
Leaving Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 나가는 노드 나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다. |
Leaving Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
모델 | 모델 배포 실패 이 작업 영역에서 실패한 모델 배포 수 |
Model Deploy Failed |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , StatusCode |
PT1M | Yes |
모델 | 모델 배포 시작 이 작업 영역에서 시작한 모델 배포 수 |
Model Deploy Started |
개수 | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Yes |
모델 | 모델 배포 성공 이 작업 영역에서 성공한 모델 배포 수 |
Model Deploy Succeeded |
개수 | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Yes |
모델 | 모델 레지스터 실패 이 작업 영역에서 실패한 모델 등록 수 |
Model Register Failed |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , StatusCode |
PT1M | Yes |
모델 | 모델 레지스터 성공 이 작업 영역에서 성공한 모델 등록 수 |
Model Register Succeeded |
개수 | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Yes |
리소스 | NetworkInputMegabytes 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkInputMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Yes |
리소스 | NetworkOutputMegabytes 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkOutputMegabytes |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Yes |
실행 | 응답 없는 실행 이 작업 영역에 대해 응답하지 않는 실행 수. 실행이 응답 없음 상태로 전환될 때 개수가 업데이트됩니다. |
Not Responding Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 시작되지 않은 실행 이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 개수가 업데이트됩니다. |
Not Started Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
할당량 | 선점된 코어 선점된 코어 수 |
Preempted Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 선점된 노드 선점된 노드 수. 사용 가능한 노드 풀에서 가져온 낮은 우선 순위 노드입니다. |
Preempted Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
실행 | 준비 중인 실행 이 작업 영역에 대해 준비 중인 실행 수. 실행 환경을 준비하는 동안 실행이 준비 중인 상태에 진입하면 개수가 업데이트됩니다. |
Preparing Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 프로비저닝 중인 실행 이 작업 영역에 대해 프로비저닝 중인 실행 수. 실행이 컴퓨팅 대상 생성 또는 프로비저닝을 기다릴 때 개수가 업데이트됩니다. |
Provisioning Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 큐에서 대기 중인 실행 이 작업 영역에 대해 큐에서 대기 중인 실행 수. 실행이 컴퓨팅 대상의 큐에서 대기할 때 수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기하는 동안 발생할 수 있습니다. |
Queued Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
할당량 | 할당량 사용률 사용한 할당량 백분율 |
Quota Utilization Percentage |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName , VmFamilyName , VmPriority |
PT1M | Yes |
실행 | 실행 시작 이 작업 영역에 대해 실행 중인 실행 수. 실행이 필요한 리소스에서 실행되기 시작할 때 개수가 업데이트됩니다. |
Started Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
실행 | 시작 중인 실행 이 작업 영역에 대해 시작된 실행 수. 실행 및 실행 정보(예: 실행 ID)를 만드는 요청이 채워지면 수가 업데이트됩니다. |
Starting Runs |
개수 | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Yes |
리소스 | StorageAPIFailureCount Azure Blob Storage API 호출 실패 횟수 |
StorageAPIFailureCount |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
리소스 | StorageAPISuccessCount Azure Blob Storage API 호출 성공 횟수 |
StorageAPISuccessCount |
개수 | 평균, 최대, 최소, 합계 | RunId , InstanceId , ComputeName |
PT1M | Yes |
할당량 | 총 코어 수 총 코어 수 |
Total Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 총 노드 수 총 노드 수. 이 합계에는 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 나가는 노드 중 일부가 포함됩니다. |
Total Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 사용 불가 코어 사용할 수 없는 코어 수 |
Unusable Cores |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
할당량 | 사용 불가 노드 사용할 수 없는 노드 수. 사용할 수 없는 노드는 확인할 수 없는 문제 때문에 작동하지 않는 노드입니다. Azure에서는 이러한 노드를 재활용합니다. |
Unusable Nodes |
개수 | 평균, 최대, 최소, 합계 | Scenario , ClusterName |
PT1M | Yes |
실행 | 경고 이 작업 영역의 실행 경고 수. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다. |
Warnings |
개수 | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | 예 |
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기