Share via


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments에 대해 지원되는 메트릭

다음 표에서는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

테이블 머리글

메트릭 - Azure Portal 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 유형입니다. 유효한 값: 평균, 최소, 최대, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어 PT1M 은 메트릭이 1분마다, PT30M 30분마다, PT1H 매시간 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다. 메트릭을 내보내는 방법에 대한 자세한 내용은 Azure Monitor에서 진단 설정 만들기를 참조하세요.

메트릭 보존에 대한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

범주 메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
리소스 CPU 메모리 사용률

인스턴스의 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
CpuMemoryUtilizationPercentage 백분율 최소, 최대, 평균 instanceId PT1M Yes
리소스 CPU 사용률

인스턴스의 CPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
CpuUtilizationPercentage 백분율 최소, 최대, 평균 instanceId PT1M Yes
리소스 분당 데이터 수집 오류

분당 삭제된 데이터 수집 이벤트 수입니다.
DataCollectionErrorsPerMinute 개수 최소, 최대, 평균 instanceId, reason, type PT1M No
리소스 분당 데이터 수집 이벤트

분당 처리된 데이터 수집 이벤트 수입니다.
DataCollectionEventsPerMinute 개수 최소, 최대, 평균 instanceId, type PT1M No
리소스 배포 용량

배포의 인스턴스 수입니다.
DeploymentCapacity 개수 최소, 최대, 평균 instanceId, State PT1M No
리소스 디스크 사용률

인스턴스의 디스크 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
DiskUtilization 백분율 최소, 최대, 평균 instanceId, disk PT1M Yes
리소스 줄 단위의 GPU 에너지

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules 개수 최소, 최대, 평균 instanceId PT1M No
리소스 GPU 메모리 사용률

인스턴스의 GPU 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilizationPercentage 백분율 최소, 최대, 평균 instanceId PT1M Yes
리소스 GPU 사용률

인스턴스의 GPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuUtilizationPercentage 백분율 최소, 최대, 평균 instanceId PT1M
트래픽 대기 시간 요청 P50

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P50 요청 대기 시간
RequestLatency_P50 밀리초 평균 <없음> PT1M
트래픽 대기 시간 요청 P90

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P90 요청 대기 시간
RequestLatency_P90 밀리초 평균 <없음> PT1M
트래픽 대기 시간 요청 P95

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P95 요청 대기 시간
RequestLatency_P95 밀리초 평균 <없음> PT1M
트래픽 대기 시간 요청 P99

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P99 요청 대기 시간
RequestLatency_P99 밀리초 평균 <없음> PT1M
트래픽 분당 요청 수

1분 이내에 온라인 배포로 전송된 요청 수
RequestsPerMinute 개수 평균 envoy_response_code PT1M