Merencanakan akselerasi GPU di server Windows

Berlaku untuk: Windows Server 2022, Windows Server 2016, Microsoft Hyper-V Server 2016, Windows Server 2019, Microsoft Hyper-V Server 2019

Artikel ini memperkenalkan kemampuan virtualisasi grafis yang tersedia di Windows Server.

Kapan menggunakan akselerasi GPU

Tergantung pada beban kerja Anda, Anda mungkin ingin mempertimbangkan akselerasi GPU. Inilah yang harus Anda pertimbangkan sebelum memilih akselerasi GPU:

  • Beban kerja jarak jauh aplikasi dan desktop (VDI/DaaS): Jika Anda membangun aplikasi atau layanan jarak jauh desktop dengan Windows Server, pertimbangkan katalog aplikasi yang Anda harapkan dijalankan pengguna Anda. Beberapa jenis aplikasi, seperti aplikasi CAD/CAM, aplikasi simulasi, game, dan aplikasi rendering/visualisasi, sangat bergantung pada penyajian 3D untuk memberikan interaktivitas yang lancar dan responsif. Sebagian besar pelanggan menganggap GPU sebagai kebutuhan untuk pengalaman pengguna yang wajar dengan jenis aplikasi ini.
  • Beban kerja rendering, pengodean, dan visualisasi jarak jauh: Beban kerja berorientasi grafis ini cenderung sangat bergantung pada kemampuan khusus GPU, seperti penyajian 3D yang efisien dan pengodean/pendekodean bingkai, untuk mencapai tujuan efektivitas biaya dan throughput. Untuk beban kerja semacam ini, satu VM berkemampuan GPU mungkin dapat mencocokkan throughput banyak VM khusus CPU.
  • Beban kerja HPC dan ML: Untuk beban kerja komputasi yang sangat paralel data, seperti komputasi berkinerja tinggi dan pelatihan atau inferensi model pembelajaran mesin, GPU dapat secara dramatis mempersingkat waktu untuk menghasilkan, waktu untuk inferensi, dan waktu pelatihan. Atau, mereka dapat menawarkan efektivitas biaya yang lebih baik daripada arsitektur khusus CPU pada tingkat performa yang sebanding. Banyak HPC dan kerangka kerja pembelajaran mesin memiliki opsi untuk mengaktifkan akselerasi GPU; pertimbangkan apakah ini mungkin menguntungkan beban kerja spesifik Anda.

Virtualisasi GPU di server Windows

Teknologi virtualisasi GPU memungkinkan akselerasi GPU di lingkungan virtual, biasanya dalam komputer virtual. Jika beban kerja Anda divirtualisasi dengan Hyper-V, maka Anda harus menggunakan virtualisasi grafis untuk menyediakan akselerasi GPU dari GPU fisik ke aplikasi atau layanan virtual Anda. Namun, jika beban kerja Anda berjalan langsung pada host Windows Server fisik, maka Anda tidak perlu virtualisasi grafis; aplikasi dan layanan Anda sudah memiliki akses ke kemampuan GPU dan API yang didukung secara asli di Windows Server.

Teknologi virtualisasi grafis berikut tersedia untuk VM Hyper-V di Windows Server:

Selain beban kerja VM, Windows Server juga mendukung akselerasi GPU beban kerja dalam kontainer dalam kontainer Windows. Untuk informasi selengkapnya, lihat Akselerasi GPU dalam kontainer Windows.

Penugasan Perangkat Diskrit (DDA)

Penugasan Perangkat Diskrit (DDA), juga dikenal sebagai pass-through GPU, memungkinkan Anda untuk mendedikasikan satu atau beberapa GPU fisik ke komputer virtual. Dalam penyebaran DDA, beban kerja virtual berjalan pada driver asli dan biasanya memiliki akses penuh ke fungsionalitas GPU. DDA menawarkan tingkat kompatibilitas aplikasi tertinggi dan performa potensial. DDA juga dapat menyediakan akselerasi GPU ke VM Linux, yang tunduk pada dukungan.

Penyebaran DDA hanya dapat mempercepat sejumlah komputer virtual terbatas, karena setiap GPU fisik dapat memberikan akselerasi ke paling banyak satu VM. Jika Anda mengembangkan layanan yang arsitekturnya mendukung komputer virtual bersama, pertimbangkan untuk menghosting beberapa beban kerja yang dipercepat per VM. Misalnya, jika Anda membangun layanan jarak jauh desktop dengan RDS, Anda dapat meningkatkan skala pengguna dengan memanfaatkan kemampuan multi-sesi Windows Server untuk menghosting beberapa desktop pengguna di setiap VM. Pengguna ini akan berbagi manfaat akselerasi GPU.

Untuk mengetahui informasi selengkapnya, lihat topik berikut:

RemoteFX vGPU

Catatan

Karena masalah keamanan, RemoteFX vGPU dinonaktifkan secara default pada semua versi Windows yang dimulai dengan Pembaruan Keamanan 14 Juli 2020 dan dihapus dimulai dengan Pembaruan Keamanan 13 April 2021. Untuk mempelajari selengkapnya, lihat KB 4570006.

RemoteFX vGPU adalah teknologi virtualisasi grafis yang memungkinkan satu GPU fisik dibagikan di antara beberapa komputer virtual. Dalam penyebaran RemoteFX vGPU, beban kerja virtual berjalan pada adaptor RemoteFX 3D Microsoft, yang mengoordinasikan permintaan pemrosesan GPU antara host dan tamu. RemoteFX vGPU paling cocok untuk pekerja pengetahuan dan beban kerja dengan ledakan tinggi di mana sumber daya GPU khusus tidak diperlukan. RemoteFX vGPU hanya dapat menyediakan akselerasi GPU untuk Windows VM.

Untuk mengetahui informasi selengkapnya, lihat topik berikut:

Membandingkan DDA dan RemoteFX vGPU

Pertimbangkan fungsionalitas berikut dan perbedaan dukungan antara teknologi virtualisasi grafis saat merencanakan penyebaran Anda:

Deskripsi RemoteFX vGPU Penetapan Perangkat Diskrit
Model sumber daya GPU Khusus atau bersama Khusus
Kepadatan VM Tinggi (satu atau beberapa GPU ke banyak VM) Rendah (satu atau beberapa GPU ke satu VM)
Kompatibilitas aplikasi DX 11.1, OpenGL 4.4, OpenCL 1.1 Semua kemampuan GPU yang disediakan oleh vendor (DX 12, OpenGL, CUDA)
AVC444 Diaktifkan secara default Tersedia melalui Kebijakan Grup
GPU VRAM VRAM khusus hingga 1 GB Hingga VRAM yang didukung oleh GPU
Kecepatan bingkai Hingga 30fps Hingga 60fps
Driver GPU di tamu Driver tampilan adaptor RemoteFX 3D (Microsoft) GPU vendor driver (NVIDIA, AMD, Intel)
Dukungan OS host Server Windows 2016 Windows Server 2016; Windows Server 2019
Dukungan OS tamu Windows Server 2012 R2; Windows Server 2016; Windows 7 SP1; Windows 8.1; Windows 10 Windows Server 2012 R2; Windows Server 2016; Windows Server 2019; Windows 10; Linux
Hypervisor Microsoft Hyper-V Microsoft Hyper-V
Perangkat keras GPU GPU perusahaan (seperti Nvidia Quadro/GRID atau AMD FirePro) GPU perusahaan (seperti Nvidia Quadro/GRID atau AMD FirePro)
Perangkat keras server Tidak ada persyaratan khusus Server modern, memaparkan IOMMU ke OS (biasanya perangkat keras yang mematuhi SR-IOV)