Ondersteunde metrische gegevens voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Artikel
03/26/2024

De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Tabelkoppen

Metrisch: de weergavenaam van de metrische gegevens zoals deze wordt weergegeven in de Azure Portal.
Naam in REST API : metrische naam zoals waarnaar wordt verwezen in de REST API.
Eenheid : maateenheid.
Aggregatie : het standaardaggregatietype . Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies - Dimensies die beschikbaar zijn voor de metrische waarde.
Tijdkorrels - Intervallen waarop de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M aan dat de metrische waarde elke minuut, PT30M elke 30 minuten, PT1H elk uur, enzovoort wordt genomen.
DS-export: of het metrische gegeven kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen. Zie Diagnostische instellingen maken in Azure Monitor voor meer informatie over het exporteren van metrische gegevens.

Zie Overzicht van metrische gegevens van Azure Monitor voor meer informatie over het bewaren van metrische gegevens.

Categorie	Metrisch	Naam in REST API	Eenheid	Aggregatie	Dimensies	Tijdkorrels	DS-export
Resource	Percentage CPU-geheugengebruik Percentage van geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`CpuMemoryUtilizationPercentage`	Percentage	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Yes
Resource	PERCENTAGE CPU-gebruik Percentage cpu-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`CpuUtilizationPercentage`	Percentage	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Yes
Resource	Fouten bij het verzamelen van gegevens per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut is verwijderd.	`DataCollectionErrorsPerMinute`	Count	Minimum, Maximum, Gemiddelde	`instanceId`, `reason`, `type`	PT1M	No
Resource	Gebeurtenissen voor gegevensverzameling per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt.	`DataCollectionEventsPerMinute`	Count	Minimum, Maximum, Gemiddelde	`instanceId`, `type`	PT1M	No
Resource	Implementatiecapaciteit Het aantal exemplaren in de implementatie.	`DeploymentCapacity`	Count	Minimum, Maximum, Gemiddelde	`instanceId`, `State`	PT1M	No
Resource	Schijfgebruik Percentage van schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`DiskUtilization`	Percentage	Minimum, Maximum, Gemiddelde	`instanceId`, `disk`	PT1M	Yes
Resource	GPU-energie in Joules Intervalenergie in Joules op een GPU-knooppunt. Energie wordt gerapporteerd met intervallen van één minuut.	`GpuEnergyJoules`	Count	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	No
Resource	Gpu-geheugengebruikspercentage Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`GpuMemoryUtilizationPercentage`	Percentage	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Yes
Resource	GPU-gebruikspercentage Percentage gpu-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`GpuUtilizationPercentage`	Percentage	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Yes
Verkeer	Aanvraaglatentie P50 De gemiddelde P50-latentie van aanvragen, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld	`RequestLatency_P50`	Milliseconden	Gemiddeld	<geen>	PT1M	Yes
Verkeer	Aanvraaglatentie P90 De gemiddelde P90-aanvraaglatentie, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld	`RequestLatency_P90`	Milliseconden	Gemiddeld	<geen>	PT1M	Yes
Verkeer	Aanvraaglatentie P95 De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld	`RequestLatency_P95`	Milliseconden	Gemiddeld	<geen>	PT1M	Yes
Verkeer	Aanvraaglatentie P99 De gemiddelde P99-aanvraaglatentie, geaggregeerd door alle latentiewaarden voor aanvragen die gedurende de geselecteerde periode zijn verzameld	`RequestLatency_P99`	Milliseconden	Gemiddeld	<geen>	PT1M	Yes
Verkeer	Aanvragen per minuut Het aantal aanvragen dat binnen een minuut naar de onlineimplementatie is verzonden	`RequestsPerMinute`	Count	Gemiddeld	`envoy_response_code`	PT1M	Nee

Ondersteunde metrische gegevens voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Feedback

Feedback

Aanvullende resources