Pemartisian GPU

Artikel
04/06/2024

Berlaku untuk: Pusat Data Windows Server 2025 (pratinjau)

Penting

Pemartisian GPU di Pusat Data Windows Server 2025 ada di PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, tersurat maupun tersirat, sehubungan dengan informasi yang diberikan di sini.

Berlaku untuk: Azure Stack HCI, versi 23H2 dan 22H2

Pemartisian GPU memungkinkan Anda berbagi perangkat GPU fisik dengan beberapa komputer virtual (VM). Dengan pemartisian GPU atau virtualisasi GPU, setiap VM mendapatkan bagian khusus dari GPU alih-alih seluruh GPU.

Fitur pemartisian GPU menggunakan antarmuka Virtualisasi IO Akar Tunggal (SR-IOV), yang menyediakan batas keamanan yang didukung perangkat keras dengan performa yang dapat diprediksi untuk setiap VM. Setiap VM hanya dapat mengakses sumber daya GPU yang didedikasikan untuk mereka dan partisi perangkat keras yang aman mencegah akses yang tidak sah oleh VM lain.

Windows Server memperkenalkan migrasi langsung dengan partisi GPU. Ada persyaratan khusus untuk menggunakan migrasi langsung partisi GPU. Selain praktik terbaik migrasi langsung yang direkomendasikan, host kluster Anda harus memiliki prosesor yang mampu melacak bit DMA Input/Output Memory Management Unit (IOMMU). Misalnya, prosesor yang mendukung Intel VT-D atau AMD-Vi. Jika Anda menggunakan Windows Server dan migrasi langsung tanpa prosesor yang diaktifkan IOMMU, VM secara otomatis dimulai ulang di mana sumber daya GPU tersedia.

Kapan menggunakan partisi GPU

Beberapa beban kerja, seperti infrastruktur desktop virtual (VDI), Inferensi Artificial Intelligent (AI) dan Pembelajaran Mesin (ML) memerlukan akselerasi GPU, partisi GPU dapat membantu mengurangi total biaya kepemilikan Untuk infrastruktur Anda secara keseluruhan.

Contohnya:

Aplikasi VDI: Pelanggan tepi terdistribusi menjalankan aplikasi produktivitas dasar, seperti Microsoft Office dan beban kerja visualisasi berat grafis di lingkungan VDI mereka, yang memerlukan akselerasi GPU. Untuk beban kerja tersebut, Anda dapat mencapai akselerasi GPU yang diperlukan melalui partisi DDA atau GPU. Dengan partisi GPU, Anda dapat membuat beberapa partisi dan menetapkan setiap partisi ke VM yang menghosting lingkungan VDI. Pemartisian GPU membantu Anda mencapai kepadatan yang diinginkan dan menskalakan jumlah pengguna yang didukung dengan urutan besaran.
Inferensi dengan ML: Pelanggan di toko ritel dan pabrik manufaktur dapat menjalankan inferensi di tepi, yang memerlukan dukungan GPU untuk server mereka. Dengan menggunakan GPU di server, Anda dapat menjalankan model ML untuk mendapatkan hasil cepat yang dapat ditindaklanjuti sebelum data dikirim ke cloud. Himpunan data lengkap secara opsional dapat ditransfer untuk terus melatih dan meningkatkan model ML Anda. Seiring dengan DDA tempat Anda menetapkan seluruh GPU fisik ke VM, pemartisian GPU memungkinkan Anda menjalankan beberapa aplikasi inferensi secara paralel pada GPU yang sama, tetapi dalam partisi fisik terpisah, sehingga menggunakan GPU secara maksimum.

Sistem operasi tamu yang didukung

Pemartisian GPU pada edisi Pusat Data Windows Server 2025 dan yang lebih baru mendukung sistem operasi tamu ini:

Pemartisian GPU di Azure Stack HCI mendukung sistem operasi tamu ini:

Windows 10 atau yang lebih baru
Multi-sesi Windows 10 Enterprise atau yang lebih baru
Windows Server 2019 atau yang lebih baru
Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS

GPU yang didukung

GPU berikut mendukung partisi GPU:

NVIDIA A2
NVIDIA A10
NVIDIA A16
NVIDIA A40
NVIDIA L4
NVIDIA L40
NVIDIA L40S

Kami menyarankan agar Anda bekerja dengan mitra Original Equipment Manufacturer (OEM) dan Vendor Perangkat Keras Independen (IHV) GPU untuk merencanakan, memesan, dan menyiapkan sistem untuk beban kerja yang Anda inginkan dengan konfigurasi yang sesuai dan perangkat lunak yang diperlukan. Namun, kami mendukung lebih banyak GPU jika Anda ingin menggunakan akselerasi GPU melalui Discrete Device Assignment (DDA). Hubungi mitra OEM dan IHV Anda untuk mendapatkan daftar GPU yang mendukung DDA. Untuk informasi selengkapnya tentang menggunakan akselerasi GPU melalui DDA, lihat Penugasan Perangkat Diskrit (DDA).

Untuk performa terbaik, kami sarankan Anda membuat konfigurasi homogen untuk GPU di semua server di kluster Anda. Konfigurasi homogen terdiri dari menginstal pembuatan dan model GPU yang sama, dan mengonfigurasi jumlah partisi yang sama di GPU di semua server dalam kluster. Misalnya, dalam kluster dua server dengan satu atau beberapa GPU terinstal, semua GPU harus memiliki pembuatan, model, dan ukuran yang sama. Jumlah partisi pada setiap GPU juga harus cocok.

Batasan

Pertimbangkan batasan berikut saat menggunakan fitur pemartisian GPU:

Pemartisian GPU tidak didukung jika konfigurasi Anda tidak homogen. Berikut adalah beberapa contoh konfigurasi yang tidak didukung:
- Mencampur GPU dari vendor yang berbeda dalam kluster yang sama.
- Menggunakan model GPU yang berbeda dari keluarga produk yang berbeda dari vendor yang sama di kluster yang sama.
Anda tidak dapat menetapkan GPU fisik sebagai Discrete Device Assignment (DDA) atau GPU yang dapat dipartisi. Anda dapat menetapkannya sebagai DDA atau sebagai GPU yang dapat dipartisi, tetapi tidak keduanya.
Anda hanya dapat menetapkan satu partisi GPU ke VM.
Partisi ditetapkan secara otomatis ke VM. Anda tidak dapat memilih partisi tertentu untuk VM tertentu.

Saat ini, pemartisian GPU di Azure Stack HCI tidak mendukung migrasi langsung VM. Tetapi VM dapat dimulai ulang dan ditempatkan secara otomatis di mana sumber daya GPU tersedia jika ada kegagalan.

Anda dapat mempartisi GPU Anda menggunakan Pusat Admin Windows atau menggunakan PowerShell. Kami menyarankan agar Anda menggunakan Pusat Admin Windows untuk mengonfigurasi dan menetapkan partisi GPU. Pusat Admin Windows secara otomatis memvalidasi konfigurasi GPU yang homogen di semua server di kluster Anda. Ini memberikan peringatan dan kesalahan yang sesuai untuk mengambil tindakan korektif yang diperlukan.
Jika menggunakan PowerShell untuk memprovisikan partisi GPU, Anda harus melakukan langkah-langkah provisi pada setiap server di kluster. Anda harus memastikan bahwa konfigurasi homogen dipertahankan secara manual untuk GPU di semua server di kluster Anda.

Saat langsung memigrasikan komputer virtual dengan partisi GPU yang ditetapkan, migrasi langsung Hyper-V secara otomatis kembali menggunakan TCP/IP dengan kompresi. Memigrasikan komputer virtual memiliki efek potensial meningkatkan pemanfaatan CPU host. Selain itu, migrasi langsung bisa memakan waktu lebih lama daripada dengan komputer virtual tanpa partisi GPU terpasang.

Untuk informasi selengkapnya tentang menggunakan GPU dengan VM dan partisi GPU Anda, lihat:

Partisi dan tetapkan GPU ke komputer virtual
Menggunakan GPU dengan VM terkluster
Mempercepat beban kerja edge Anda dengan blog solusi Azure Stack HCI yang didukung GPU NVIDIA yang terjangkau

Untuk informasi selengkapnya tentang menggunakan GPU dengan VM dan partisi GPU Anda, lihat:

Partisi dan tetapkan GPU ke komputer virtual
Menggunakan GPU dengan VM terkluster
Mempercepat beban kerja edge Anda dengan blog solusi Azure Stack HCI yang didukung GPU NVIDIA yang terjangkau

Bagikan melalui

Pemartisian GPU

Kapan menggunakan partisi GPU

Sistem operasi tamu yang didukung

GPU yang didukung

Batasan

Sumber Daya Tambahan:

Bagikan melalui

Pemartisian GPU

Kapan menggunakan partisi GPU

Sistem operasi tamu yang didukung

GPU yang didukung

Batasan

Konten terkait

Sumber Daya Tambahan: