Seri NDm A100 v4

Perhatian

Artikel ini mereferensikan CentOS, distribusi Linux yang mendekati status End Of Life (EOL). Harap pertimbangkan penggunaan dan rencanakan yang sesuai. Untuk informasi selengkapnya, lihat panduan Akhir Masa Pakai CentOS.

Berlaku untuk: ✔️ Mesin virtual Linux ✔️ Mesin virtual Windows ✔️ Set skala fleksibel ✔️ Set skala seragam

Mesin virtual (VM) seri NDm A100 v4 adalah tambahan unggulan baru untuk keluarga GPU Azure. Ini dirancang untuk pelatihan Deep Pembelajaran kelas atas dan meningkatkan skala dan menskalakan beban kerja HPC yang digabungkan dengan erat.

Seri NDm A100 v4 dimulai dengan satu VM dan delapan GPU NVIDIA Ampere A100 80GB Tensor Core. Penyebaran berbasis NDm A100 v4 dapat menskalakan hingga ribuan GPU dengan bandwidth interkoneksi 1,6 TB/dtk per VM. Setiap GPU dalam VM disediakan dengan koneksi NVIDIA Mellanox HDR InfiniBand khusus, topologi-agnostik 200 GB/dtk. Koneksi ini secara otomatis dikonfigurasi antara VM yang menempati set skala VM yang sama, dan mendukung GPUDirect RDMA.

Setiap GPU memiliki konektivitas NVLINK 3.0 untuk komunikasi dalam VM, dan instans didukung oleh 96 core CPU AMD Epyc™ 7V12 (Roma) generasi ke-2 fisik.

Instans ini memberikan performa yang sangat baik untuk berbagai alat AI, ML, dan analitik yang mendukung akselerasi GPU 'out-of-box,' seperti TensorFlow, Pytorch, Caffe, RAPIDS, dan kerangka kerja lainnya. Selain itu, interkoneksi InfiniBand peluasan skala didukung oleh sekumpulan besar alat AI dan HPC yang ada yang dibangun di atas pustaka komunikasi NCCL2 NVIDIA untuk pengklusteran GPU yang mulus.

Penting

Untuk memulai dengan VM NDm A100 v4, lihat Konfigurasi dan Pengoptimalan Beban Kerja HPC untuk mengetahui langkah-langkahnya termasuk konfigurasi driver dan jaringan. Karena peningkatan jejak I/O memori GPU, NDm A100 v4 membutuhkan penggunaan VM Generasi 2 dan gambar marketplace. Gambar Azure HPC sangat direkomendasikan. Gambar Azure HPC Ubuntu 18.04, 20.04 dan Azure HPC CentOS 7.9 didukung.


Penyimpanan Premium: Didukung
Penembolokan Penyimpanan Premium: Didukung
Disk Ultra: Didukung (Pelajari selengkapnya tentang ketersediaan, penggunaan, dan performa)
Migrasi Langsung: Tidak Didukung
Pembaruan yang Menyimpan Memori: Tidak Didukung
Dukungan Generasi VM: Generasi 2
Jaringan yang Dipercepat: Didukung
Disk OS Sementara: Didukung
InfiniBand: Didukung, GPUDirect RDMA, 8 x 200 Gigabit HDR
Interkoneksi Nvidia NVLink: Didukung
Virtualisasi Berlapis: Tidak Didukung

Seri NDm A100 v4 mendukung versi kernel berikut:
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

Ukuran vCPU Memori: GiB Penyimpanan Sementara (SSD): GiB GPU Memori GPU: GiB Disk data maksimal Throughput disk maksimal yang tidak ditembolokkan: IOPS/MBps Bandwidth jaringan maks NIC Maksimum
Standard_ND96amsr_A100_v4 96 1900 6400 8 GPU A100 80 GB (NVLink 3.0) 80 32 80.000 / 800 24.000 Mbps 8

Definisi tabel ukuran

  • Kapasitas penyimpanan ditampilkan dalam unit GiB atau 1024^3 byte. Saat membandingkan disk yang diukur dalam GB (1000^3 byte) dengan disk yang diukur dalam GiB (1024^3), ingat bahwa jumlah kapasitas yang diberikan dalam GiB mungkin tampak lebih kecil. Misalnya, 1023 GiB = 1098,4 GB.

  • Throughput disk diukur dalam operasi input/output per detik (IOPS) dan MBps di mana MBps = 10^6 byte/detik.

  • Disk data dapat beroperasi dalam mode cache atau tidak di-cache. Untuk operasi disk data cache, mode cache host diatur ke ReadOnly atau ReadWrite. Untuk operasi disk data yang tidak di-cache, mode cache host diatur ke None.

  • Untuk mempelajari cara mendapatkan performa penyimpanan terbaik untuk VM Anda, lihat Komputer virtual dan performa disk.

  • Bandwidth jaringan yang diharapkan adalah bandwidth agregat maksimum yang dialokasikan per jenis VM di semua NIC, untuk semua tujuan. Untuk informasi selengkapnya, lihat Bandwidth jaringan komputer virtual.

    Batas atas tidak dijamin. Batas menawarkan panduan untuk memilih jenis VM yang tepat untuk aplikasi yang dimaksud. Performa jaringan aktual akan tergantung pada beberapa faktor termasuk kemacetan jaringan, beban aplikasi, dan pengaturan jaringan. Untuk mengetahui informasi tentang mengoptimalkan throughput jaringan, lihat Mengoptimalkan throughput jaringan untuk komputer virtual Azure. Untuk mencapai performa jaringan yang diharapkan di Linux atau Windows, Anda mungkin perlu memilih versi tertentu atau mengoptimalkan VM Anda. Untuk mengetahui informasi selengkapnya, lihat Pengujian Bandwidth/Throughput (NTTTCP).

Ukuran serta informasi lainnya

Kalkulator Harga: Kalkulator Harga

Untuk mengetahui informasi selengkapnya tentang jenis disk, lihat Jenis disk apa yang tersedia di Azure?

Langkah berikutnya

Pelajari selengkapnya tentang cara pelajaran komputasi Azure (ACU) dapat membantu Anda membandingkan performa komputasi di seluruh SKU Azure.