Ekstensi Driver GPU NVIDIA untuk Linux

Perhatian

Artikel ini mereferensikan CentOS, distribusi Linux yang mendekati status End Of Life (EOL). Harap pertimbangkan penggunaan dan rencanakan yang sesuai. Untuk informasi selengkapnya, lihat panduan Akhir Masa Pakai CentOS.

Ekstensi ini memasang driver GPU NVIDIA di Mesin Virtual Linux seri N. Tergantung pada keluarga VM, ekstensi ini memasang driver CUDA atau GRID. Saat menginstal driver NVIDIA menggunakan ekstensi ini, Anda menerima dan menyetujui ketentuan Perjanjian Lisensi Pengguna Akhir NVIDIA. Selama proses penginstalan, mesin virtual mungkin melakukan reboot untuk menyelesaikan pengaturan driver.

Petunjuk tentang penginstalan manual driver dan versi yang didukung saat ini tersedia. Ekstensi juga tersedia untuk menginstal driver GPU NVIDIA pada VM Windows seri N.

Catatan

Dengan Boot Aman diaktifkan, semua komponen boot OS (boot loader, kernel, kernel driver) harus ditandatangani oleh penerbit tepercaya (kunci yang dipercaya oleh sistem). Boot Aman tidak didukung menggunakan ekstensi Windows atau Linux. Untuk informasi selengkapnya tentang menginstal driver GPU secara manual dengan Boot Aman diaktifkan, lihat Penyiapan driver GPU seri N Azure untuk Linux.

Catatan

Ekstensi driver GPU tidak secara otomatis memperbarui driver setelah ekstensi diinstal. Jika Anda perlu pindah ke versi driver yang lebih baru, unduh dan instal driver secara manual atau hapus dan tambahkan ekstensi lagi.

Prasyarat

Sistem operasi

Ekstensi ini mendukung distro OS berikut, bergantung pada dukungan driver untuk versi OS tertentu:

Distribusi Versi
Linux Ubuntu: 20.04 LTS
Linux: Red Hat Enterprise Linux 7.9
Linux: CentOS 7

Catatan

Driver CUDA terbaru yang didukung untuk mesin virtual seri NC saat ini adalah versi 470.82.01. Versi driver yang lebih baru tidak didukung pada kartu K80 di NC. Sementara ekstensi sedang diperbarui dengan akhir dukungan untuk NC ini, silakan pasang driver CUDA secara manual untuk kartu K80 pada seri NC.

Penting

Dokumen ini mereferensikan versi rilis Linux yang mendekati atau di, Akhir Masa Pakai (EOL). Harap pertimbangkan untuk memperbarui ke versi yang lebih baru.

Konektivitas internet

Ekstensi Microsoft Azure untuk Driver GPU NVIDIA mengharuskan mesin virtual target tersambung ke internet dan memiliki akses.

Skema ekstensi

JSON berikut menunjukkan skema untuk ekstensi:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Properti

Nama Nilai/Contoh Jenis Data
apiVersion 2015-06-15 date
penerbit Microsoft.HpcCompute string
jenis NvidiaGpuDriverLinux string
typeHandlerVersion 1.6 int

Pengaturan

Semua pengaturan bersifat opsional. Perilaku default tidak memperbarui kernel jika tidak diperlukan untuk penginstalan driver, pasang driver terbaru yang didukung dan toolkit CUDA (sebagaimana berlaku).

Nama Deskripsi Nilai default Nilai yang valid Jenis Data
updateOS Memperbarui kernel meskipun tidak diperlukan untuk penginstalan driver. salah true, false Boolean
driverVersion NV: Versi driver GRID.
NC/ND: Versi toolkit CUDA. Driver terbaru untuk CUDA yang dipilih diinstal secara otomatis.
terbaru Daftar versi driver yang didukung string
installCUDA Instal toolkit CUDA. Hanya relevan untuk VM seri NC/ND. benar true, false Boolean

Penyebaran

Portal Azure

Anda dapat menyebarkan ekstensi mesin virtual NVIDIA Azure di portal Microsoft Azure.

  1. Di browser, buka portal Microsoft Azure.

  2. Buka mesin virtual tempat Anda ingin menginstal driver.

  3. Di menu sebelah kiri, pilih Ekstensi.

    Cuplikan layar yang memperlihatkan memilih Ekstensi di menu portal Microsoft Azure.

  4. Pilih Tambahkan.

    Cuplikan layar yang memperlihatkan menambahkan ekstensi mesin virtual untuk mesin virtual yang dipilih.

  5. Gulir untuk menemukan dan memilih Ekstensi Driver GPU NVIDIA, lalu pilih Berikutnya.

    Cuplikan layar yang memperlihatkan memilih driver NVIDIA G P U.

  6. Pilih Tinjau + buat, dan pilih Buat. Tunggu beberapa menit hingga proyek disebarkan.

    Cuplikan layar yang memperlihatkan memilih tombol Tinjau + buat.

  7. Verifikasi bahwa ekstensi ditambahkan ke daftar ekstensi yang diinstal.

    Cuplikan layar yang memperlihatkan ekstensi baru dalam daftar ekstensi untuk mesin virtual.

Templat Azure Resource Manager

Anda dapat menggunakan templat Azure Resource Manager untuk menyebarkan ekstensi mesin virtual Azure. Templat sangat ideal saat menyebarkan satu atau beberapa mesin virtual yang memerlukan konfigurasi pasca penyebaran.

Konfigurasi JSON untuk ekstensi mesin virtual dapat disarangkan di dalam sumber daya mesin virtual atau ditempatkan di akar atau tingkat teratas templat JSON Resource Manager. Penempatan konfigurasi JSON memengaruhi nilai nama dan jenis sumber daya. Untuk informasi selengkapnya, lihat Set nama dan jenis untuk sumber daya elemen anak.

Contoh berikut mengasumsikan ekstensi bersarang di dalam sumber daya komputer virtual. Saat sumber daya ekstensi disarangkan, JSON ditempatkan di objek "resources": [] dari mesin virtual.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverLinux" `
    -ExtensionType "NvidiaGpuDriverLinux" `
    -TypeHandlerVersion 1.6 `
    -SettingString '{ `
	}'

Azure CLI

Contoh berikut mencerminkan contoh Azure Resource Manager dan PowerShell sebelumnya:

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6

Contoh berikut juga menambahkan dua pengaturan kustom opsional sebagai contoh untuk penginstalan driver non-default. Secara khusus, ini memperbarui kernel OS ke yang terbaru dan menginstal driver versi toolkit CUDA tertentu. Sekali lagi, perhatikan --settings adalah opsional dan default. Memperbarui kernel dapat meningkatkan waktu penginstalan ekstensi. Selain itu, memilih versi toolkit CUDA (lama) tertentu mungkin tidak selalu kompatibel dengan kernel yang lebih baru.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6 \
  --settings '{ \
    "updateOS": true, \
    "driverVersion": "10.0.130" \
  }'

Pemecahan masalah dan dukungan

Pecahkan masalah

Anda dapat mengambil data mengenai status penyebaran ekstensi dari portal Microsoft Azure dan menggunakan Azure PowerShell dan Azure CLI. Untuk melihat status penyebaran ekstensi untuk komputer virtual tertentu, jalankan perintah berikut:

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Output eksekusi ekstensi dicatat ke file berikut. Lihat file ini untuk melacak status penginstalan (jangka panjang) serta untuk memecahkan masalah kegagalan apa pun.

/var/log/azure/nvidia-vmext-status

Kode keluar

Keluar dari kode Makna Tindakan kemungkinan
0 Operasi berhasil
1 Penggunaan ekstensi yang salah Periksa log keluaran eksekusi.
10 SSIS Linux untuk Hyper-V dan Azure tidak tersedia atau diinstal Periksa output dari lspci.
11 GPU NVIDIA tidak ditemukan pada ukuran VM ini Gunakan ukuran mesin virtual dan OS yang didukung.
12 Penawaran gambar tidak didukung
13 Ukuran VM tidak didukung Gunakan mesin virtual seri N untuk menyebarkan.
14 Operasi tidak berhasil Periksa log keluaran eksekusi.

Dukungan

Jika Anda memerlukan bantuan lebih lanjut kapan saja dalam artikel ini, hubungi pakar Azure di forum MSDN Azure dan Stack Overflow. Atau, Anda dapat mengajukan insiden dukungan Azure. Buka Dukungan Azure dan pilih Dapatkan dukungan. Untuk informasi mengenai penggunaan dukungan Azure, baca Tanya Jawab Umum dukungan Azure.

Langkah berikutnya