Obsługiwane metryki dla microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

W poniższej tabeli wymieniono metryki dostępne dla typu zasobu Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Nagłówki tabeli

Metryka — nazwa wyświetlana metryki wyświetlana wyświetlana w Azure Portal.
Nazwa w interfejsie API REST — nazwa metryki, określona w interfejsie API REST.
Jednostka — jednostka miary.
Agregacja — domyślny typ agregacji . Prawidłowe wartości: Average, Minimum, Maximum, Total, Count.
Wymiary - Wymiary dostępne dla metryki.
Ziarna - czasuInterwały, w których próbkowana jest metryka. Na przykład wskazuje, PT1M że metryka jest próbkowana co minutę, PT30M co 30 minut, PT1H co godzinę itd.
Eksportowanie ds — określa, czy metryka jest eksportowana do dzienników usługi Azure Monitor za pośrednictwem ustawień diagnostycznych. Aby uzyskać informacje na temat eksportowania metryk, zobacz Tworzenie ustawień diagnostycznych w usłudze Azure Monitor.

Aby uzyskać informacje na temat przechowywania metryk, zobacz Omówienie metryk usługi Azure Monitor.

Kategoria Metric Nazwa w interfejsie API REST Jednostka Agregacja Wymiary Ziarna czasu Eksportowanie ds
Zasób Procent wykorzystania pamięci procesora CPU

Procent wykorzystania pamięci w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
CpuMemoryUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Procent wykorzystania procesora CPU

Procent wykorzystania procesora CPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
CpuUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Błędy zbierania danych na minutę

Liczba zdarzeń zbierania danych spadła na minutę.
DataCollectionErrorsPerMinute Liczba Minimum, Maksimum, Średnia instanceId, reason, type PT1M Nie
Zasób Zdarzenia zbierania danych na minutę

Liczba przetworzonych zdarzeń zbierania danych na minutę.
DataCollectionEventsPerMinute Liczba Minimum, Maksimum, Średnia instanceId, type PT1M Nie
Zasób Pojemność wdrożenia

Liczba wystąpień we wdrożeniu.
DeploymentCapacity Liczba Minimum, Maksimum, Średnia instanceId, State PT1M Nie
Zasób Wykorzystanie dysku

Procent wykorzystania dysku w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
DiskUtilization Procent Minimum, Maksimum, Średnia instanceId, disk PT1M Tak
Zasób Energia procesora GPU w joulesach

Interwał energii w joules w węźle procesora GPU. Energia jest zgłaszana w odstępach jednej minuty.
GpuEnergyJoules Liczba Minimum, Maksimum, Średnia instanceId PT1M Nie
Zasób Procent wykorzystania pamięci procesora GPU

Procent wykorzystania pamięci procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
GpuMemoryUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Procent wykorzystania procesora GPU

Procent wykorzystania procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
GpuUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Ruch Opóźnienie żądania P50

Średnie opóźnienie żądania P50 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie
RequestLatency_P50 Milisekund Średnia <brak> PT1M Tak
Ruch Opóźnienie żądania P90

Średnie opóźnienie żądania P90 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie
RequestLatency_P90 Milisekund Średnia <brak> PT1M Tak
Ruch Opóźnienie żądania P95

Średnie opóźnienie żądań P95 zagregowane według wszystkich wartości opóźnienia żądań zebranych w wybranym okresie
RequestLatency_P95 Milisekund Średnia <brak> PT1M Tak
Ruch Opóźnienie żądania P99

Średnie opóźnienie żądań P99 zagregowane przez wszystkie wartości opóźnień żądań zebrane w wybranym okresie
RequestLatency_P99 Milisekund Średnia <brak> PT1M Tak
Ruch Żądania na minutę

Liczba żądań wysyłanych do wdrożenia online w ciągu minuty
RequestsPerMinute Liczba Średnia envoy_response_code PT1M Nie