Metrik yang didukung untuk Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Tabel berikut mencantumkan metrik yang tersedia untuk jenis sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Judul tabel
Metrik - Nama tampilan metrik seperti yang muncul di portal Azure.
Nama di Rest API - Nama metrik seperti yang disebutkan dalam REST API.
Unit - Satuan ukuran.
Agregasi - Jenis agregasi default. Nilai yang valid: Rata-rata, Minimum, Maksimum, Total, Hitungan.
Dimensi - Dimensi tersedia untuk metrik.
Butir - WaktuInterval tempat metrik diambil sampelnya. Misalnya, PT1M
menunjukkan bahwa metrik diambil sampelnya setiap menit, PT30M
setiap 30 menit, PT1H
setiap jam, dan sebagainya.
Ekspor DS- Apakah metrik dapat diekspor ke Log Azure Monitor melalui Pengaturan Diagnostik. Untuk informasi tentang mengekspor metrik, lihat Membuat pengaturan diagnostik di Azure Monitor.
Untuk informasi tentang retensi metrik, lihat Gambaran umum Metrik Azure Monitor.
Kategori | Metrik | Nama dalam REST API | Unit | Agregat | Dimensi | Butir Waktu | Ekspor DS |
---|---|---|---|---|---|---|---|
Sumber daya | Persentase Pemanfaatan Memori CPU Persentase pemanfaatan memori pada instans. Pemanfaatan dilaporkan pada interval satu menit. |
CpuMemoryUtilizationPercentage |
Persen | Minimum, Maksimum, Rata-Rata | instanceId |
PT1M | Ya |
Sumber daya | Persentase Pemanfaatan CPU Persentase pemanfaatan CPU pada instans. Pemanfaatan dilaporkan pada interval satu menit. |
CpuUtilizationPercentage |
Persen | Minimum, Maksimum, Rata-Rata | instanceId |
PT1M | Ya |
Sumber daya | Kesalahan Pengumpulan Data Per Menit Jumlah peristiwa pengumpulan data yang dihilangkan per menit. |
DataCollectionErrorsPerMinute |
Jumlah | Minimum, Maksimum, Rata-Rata | instanceId , reason , type |
PT1M | Tidak |
Sumber daya | Peristiwa Pengumpulan Data Per Menit Jumlah peristiwa pengumpulan data yang diproses per menit. |
DataCollectionEventsPerMinute |
Jumlah | Minimum, Maksimum, Rata-Rata | instanceId , type |
PT1M | Tidak |
Sumber daya | Kapasitas Penyebaran Jumlah instans dalam penyebaran. |
DeploymentCapacity |
Jumlah | Minimum, Maksimum, Rata-Rata | instanceId , State |
PT1M | Tidak |
Sumber daya | Penggunaan Disk Persentase pemanfaatan disk pada instans. Pemanfaatan dilaporkan pada interval satu menit. |
DiskUtilization |
Persen | Minimum, Maksimum, Rata-Rata | instanceId , disk |
PT1M | Ya |
Sumber daya | GPU Energi di Joules Interval energi dalam satuan Joule pada node GPU. Energi dilaporkan pada interval satu menit. |
GpuEnergyJoules |
Jumlah | Minimum, Maksimum, Rata-Rata | instanceId |
PT1M | Tidak |
Sumber daya | Persentase Pemanfaatan Memori GPU Persentase pemanfaatan memori GPU pada instans. Pemanfaatan dilaporkan pada interval satu menit. |
GpuMemoryUtilizationPercentage |
Persen | Minimum, Maksimum, Rata-Rata | instanceId |
PT1M | Ya |
Sumber daya | Persentase Pemanfaatan GPU Persentase pemanfaatan GPU pada instans. Pemanfaatan dilaporkan pada interval satu menit. |
GpuUtilizationPercentage |
Persen | Minimum, Maksimum, Rata-Rata | instanceId |
PT1M | Ya |
Lalu lintas | Latensi Permintaan P50 Latensi permintaan P50 rata-rata dikumpulkan oleh semua nilai latensi permintaan yang dikumpulkan selama periode waktu yang dipilih |
RequestLatency_P50 |
Millidetik | Rata-rata | <tidak ada> | PT1M | Ya |
Lalu lintas | Minta Latensi P90 Latensi permintaan P90 rata-rata dikumpulkan oleh semua nilai latensi permintaan yang dikumpulkan selama periode waktu yang dipilih |
RequestLatency_P90 |
Millidetik | Rata-rata | <tidak ada> | PT1M | Ya |
Lalu lintas | Latensi Permintaan P95 Latensi permintaan P95 rata-rata dikumpulkan oleh semua nilai latensi permintaan yang dikumpulkan selama periode waktu yang dipilih |
RequestLatency_P95 |
Millidetik | Rata-rata | <tidak ada> | PT1M | Ya |
Lalu lintas | Latensi Permintaan P99 Latensi permintaan P99 rata-rata dikumpulkan oleh semua nilai latensi permintaan yang dikumpulkan selama periode waktu yang dipilih |
RequestLatency_P99 |
Millidetik | Rata-rata | <tidak ada> | PT1M | Ya |
Lalu lintas | Permintaan Per Menit Jumlah permintaan yang dikirim ke penyebaran online dalam waktu satu menit |
RequestsPerMinute |
Jumlah | Rata-rata | envoy_response_code |
PT1M | Tidak |
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk