Ondersteunde metrische gegevens voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Tabelkoppen
Metrisch: de weergavenaam van de metrische gegevens zoals deze wordt weergegeven in de Azure Portal.
Naam in REST API : metrische naam zoals waarnaar wordt verwezen in de REST API.
Eenheid : maateenheid.
Aggregatie : het standaardaggregatietype . Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies - Dimensies die beschikbaar zijn voor de metrische waarde.
Tijdkorrels - Intervallen waarop de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M
aan dat de metrische waarde elke minuut, PT30M
elke 30 minuten, PT1H
elk uur, enzovoort wordt genomen.
DS-export: of het metrische gegeven kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen. Zie Diagnostische instellingen maken in Azure Monitor voor meer informatie over het exporteren van metrische gegevens.
Zie Overzicht van metrische gegevens van Azure Monitor voor meer informatie over het bewaren van metrische gegevens.
Categorie | Metrisch | Naam in REST API | Eenheid | Aggregatie | Dimensies | Tijdkorrels | DS-export |
---|---|---|---|---|---|---|---|
Resource | Percentage CPU-geheugengebruik Percentage van geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
CpuMemoryUtilizationPercentage |
Percentage | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Yes |
Resource | PERCENTAGE CPU-gebruik Percentage cpu-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
CpuUtilizationPercentage |
Percentage | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Yes |
Resource | Fouten bij het verzamelen van gegevens per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut is verwijderd. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Gemiddelde | instanceId , reason , type |
PT1M | No |
Resource | Gebeurtenissen voor gegevensverzameling per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Gemiddelde | instanceId , type |
PT1M | No |
Resource | Implementatiecapaciteit Het aantal exemplaren in de implementatie. |
DeploymentCapacity |
Count | Minimum, Maximum, Gemiddelde | instanceId , State |
PT1M | No |
Resource | Schijfgebruik Percentage van schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
DiskUtilization |
Percentage | Minimum, Maximum, Gemiddelde | instanceId , disk |
PT1M | Yes |
Resource | GPU-energie in Joules Intervalenergie in Joules op een GPU-knooppunt. Energie wordt gerapporteerd met intervallen van één minuut. |
GpuEnergyJoules |
Count | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | No |
Resource | Gpu-geheugengebruikspercentage Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
GpuMemoryUtilizationPercentage |
Percentage | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Yes |
Resource | GPU-gebruikspercentage Percentage gpu-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
GpuUtilizationPercentage |
Percentage | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Yes |
Verkeer | Aanvraaglatentie P50 De gemiddelde P50-latentie van aanvragen, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld |
RequestLatency_P50 |
Milliseconden | Gemiddeld | <geen> | PT1M | Yes |
Verkeer | Aanvraaglatentie P90 De gemiddelde P90-aanvraaglatentie, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld |
RequestLatency_P90 |
Milliseconden | Gemiddeld | <geen> | PT1M | Yes |
Verkeer | Aanvraaglatentie P95 De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld |
RequestLatency_P95 |
Milliseconden | Gemiddeld | <geen> | PT1M | Yes |
Verkeer | Aanvraaglatentie P99 De gemiddelde P99-aanvraaglatentie, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld |
RequestLatency_P99 |
Milliseconden | Gemiddeld | <geen> | PT1M | Yes |
Verkeer | Aanvragen per minuut Het aantal aanvragen dat binnen een minuut naar de onlineimplementatie is verzonden |
RequestsPerMinute |
Count | Gemiddeld | envoy_response_code |
PT1M | Nee |
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor