Windows Server에서 GPU 가속 계획

적용 대상: Windows Server 2022, Windows Server 2016, Microsoft Hyper-V Server 2016, Windows Server 2019, Microsoft Hyper-V Server 2019

이 문서에서는 Windows Server에서 사용할 수 있는 그래픽 가상화 기능을 소개합니다.

GPU 가속을 사용하는 경우

워크로드에 따라 GPU 가속을 고려할 수 있습니다. GPU 가속을 선택하기 전에 고려해야 할 사항은 다음과 같습니다.

  • 앱 및 데스크톱 원격(VDI/DaaS) 워크로드: Windows Server를 사용하여 앱 또는 데스크톱 원격 서비스를 빌드하는 경우 사용자가 실행할 것으로 예상되는 앱 카탈로그를 고려합니다. CAD/CAM 앱, 시뮬레이션 앱, 게임 및 렌더링/시각화 앱과 같은 일부 유형의 앱은 3D 렌더링에 크게 의존하여 원활하고 반응형 대화형 작업을 제공합니다. 대부분의 고객은 이러한 종류의 앱에서 합리적인 사용자 환경을 위해 GPU가 필요하다고 간주합니다.
  • 원격 렌더링, 인코딩 및 시각화 워크로드: 이러한 그래픽 기반 워크로드는 비용 효율성 및 처리량 목표를 달성하기 위해 효율적인 3D 렌더링 및 프레임 인코딩/디코딩과 같은 GPU의 특수 기능에 크게 의존하는 경향이 있습니다. 이러한 종류의 워크로드의 경우 단일 GPU 사용 VM이 많은 CPU 전용 VM의 처리량과 일치할 수 있습니다.
  • HPC 및 ML 워크로드: 고성능 컴퓨팅 및 기계 학습 모델 학습 또는 유추와 같은 데이터 병렬 계산 워크로드의 경우 GPU는 결과 시간, 유추 시간 및 학습 시간을 크게 단축할 수 있습니다. 또는 비슷한 성능 수준에서 CPU 전용 아키텍처보다 더 나은 비용 효율성을 제공할 수 있습니다. 많은 HPC 및 기계 학습 프레임워크에는 GPU 가속을 사용하도록 설정하는 옵션이 있습니다. 특정 워크로드에 도움이 될 수 있는지 여부를 고려합니다.

Windows Server의 GPU 가상화

GPU 가상화 기술을 사용하면 일반적으로 가상 머신 내에서 가상화된 환경에서 GPU 가속을 수행할 수 있습니다. 워크로드가 Hyper-V를 사용하여 가상화되는 경우 물리적 GPU에서 가상화된 앱 또는 서비스로 GPU 가속을 제공하기 위해 그래픽 가상화를 사용해야 합니다. 그러나 워크로드가 실제 Windows Server 호스트에서 직접 실행되는 경우 그래픽 가상화가 필요하지 않습니다. 앱과 서비스는 이미 Windows Server에서 기본적으로 지원되는 GPU 기능 및 API에 액세스할 수 있습니다.

다음 그래픽 가상화 기술은 Windows Server의 Hyper-V VM에서 사용할 수 있습니다.

Windows Server는 VM 워크로드 외에도 Windows 컨테이너 내에서 컨테이너화된 워크로드의 GPU 가속을 지원합니다. 자세한 내용은 Windows 컨테이너의 GPU 가속을 참조 하세요.

DDA(불연속 디바이스 할당)

GPU 통과라고도 하는 DDA(불연속 디바이스 할당)를 사용하면 하나 이상의 물리적 GPU를 가상 머신에 헌정할 수 있습니다. DDA 배포에서 가상화된 워크로드는 네이티브 드라이버에서 실행되며 일반적으로 GPU의 기능에 대한 모든 권한을 갖습니다. DDA는 최고 수준의 앱 호환성 및 잠재적 성능을 제공합니다. DDA는 지원 대상인 Linux VM에 GPU 가속을 제공할 수도 있습니다.

각 물리적 GPU는 최대 하나의 VM에 가속을 제공할 수 있으므로 DDA 배포는 제한된 수의 가상 머신만 가속화할 수 있습니다. 아키텍처에서 공유 가상 머신을 지원하는 서비스를 개발하는 경우 VM당 여러 가속 워크로드를 호스팅하는 것이 좋습니다. 예를 들어 RDS를 사용하여 데스크톱 원격 서비스를 빌드하는 경우 Windows Server의 다중 세션 기능을 활용하여 각 VM에서 여러 사용자 데스크톱을 호스트하여 사용자 규모를 향상시킬 수 있습니다. 이러한 사용자는 GPU 가속의 이점을 공유합니다.

자세한 내용은 다음 항목을 참조하세요.

RemoteFX vGPU

참고 항목

보안 문제로 인해 RemoteFX vGPU는 2020년 7월 14일 보안 업데이트부터 모든 버전의 Windows에서 기본적으로 사용할 수 없게 되고 2021년 4월 13일 보안 업데이트부터 제거됩니다. 자세한 내용은 KB 4570006을 참조하세요.

RemoteFX vGPU는 단일 물리적 GPU를 여러 가상 머신 간에 공유할 수 있는 그래픽 가상화 기술입니다. RemoteFX vGPU 배포에서 가상화된 워크로드는 호스트와 게스트 간의 GPU 처리 요청을 조정하는 Microsoft의 RemoteFX 3D 어댑터에서 실행됩니다. RemoteFX vGPU는 전용 GPU 리소스가 필요하지 않은 지식 근로자 및 높은 버스트 워크로드에 가장 적합합니다. RemoteFX vGPU는 Windows VM에 GPU 가속만 제공할 수 있습니다.

자세한 내용은 다음 항목을 참조하세요.

DDA 및 RemoteFX vGPU 비교

다음 기능을 고려하고 배포를 계획할 때 그래픽 가상화 기술 간의 차이점을 지원합니다.

설명 RemoteFX vGPU 개별 디바이스 할당
GPU 리소스 모델 전용 또는 공유 전용 전용
VM 밀도 높음(여러 VM에 하나 이상의 GPU) 낮음(하나 이상의 GPU에서 하나의 VM으로)
앱 호환성 DX 11.1, OpenGL 4.4, OpenCL 1.1 공급 기업에서 제공하는 모든 GPU 기능(DX 12, OpenGL, CUDA)
AVC444 기본값으로 사용 설정됨 그룹 정책을 통해 사용 가능
GPU VRAM 최대 1GB 전용 VRAM GPU에서 지원하는 최대 VRAM
프레임 속도 최대 30fps 최대 60fps
게스트의 GPU 드라이버 RemoteFX 3D 어댑터 디스플레이 드라이버(Microsoft) GPU 공급업체 드라이버(NVIDIA, AMD, Intel)
호스트 OS 지원 Windows Server 2016 Windows Server 2016; Windows Server 2019
게스트 OS 지원 Windows Server 2012 R2; Windows Server 2016; Windows 7 SP1; Windows 8.1; Windows 10 Windows Server 2012 R2; Windows Server 2016; Windows Server 2019; Windows 10; 리눅스
하이퍼바이저 Microsoft Hyper-V Microsoft Hyper-V
GPU 하드웨어 엔터프라이즈 GPU(예: Nvidia Quadro/GRID 또는 AMD FirePro) 엔터프라이즈 GPU(예: Nvidia Quadro/GRID 또는 AMD FirePro)
서버 하드웨어 특별한 요구 사항 없음 최신 서버, OS에 IOMMU 노출(일반적으로 SR-IOV 호환 하드웨어)