GPU (Graphics Processing Unit) virtuele machine (VM) op Azure Stack Hub

Van toepassing op: Azure Stack Hub geïntegreerde systemen

In dit artikel wordt beschreven welke GPU-modellen (Graphics Processing Unit) worden ondersteund op een Azure Stack Hub geïntegreerd systeem. U kunt ook instructies vinden voor het installeren van de stuurprogramma's die worden gebruikt met de GPU's. GPU-ondersteuning in Azure Stack Hub maakt oplossingen mogelijk, zoals kunstmatige intelligentie, training, deferentie en gegevensvisualisatie. De AMD Radeon Wilt MI25 kan worden gebruikt ter ondersteuning van grafisch-intensieve toepassingen, zoals Autodesk AutoCAD.

U kunt kiezen uit drie GPU-modellen. Ze zijn beschikbaar in gpu's van NVIDIA V100, NVIDIA T4 en AMD MI25. Deze fysieke GPU's worden als volgt uitgelijnd met de volgende typen virtuele machines uit de Azure N-serie:

Waarschuwing

GPU-VM's worden niet ondersteund in deze release. U moet een upgrade uitvoeren naar Azure Stack Hub 2005 of hoger. Daarnaast moet uw Azure Stack Hub hardware fysieke GPU's hebben.

NCv3

VM's uit de NCv3-serie powered by NVIDIA Tesla V100 GPU's. Klanten kunnen profiteren van deze bijgewerkte GPU's voor traditionele HPC-workloads, zoals reservoirmodelleren, DNA-sequencing, analyse van voedsel, Monte Carlo-simulaties en andere.

Grootte vCPU Geheugen: GiB Tijdelijke opslag (SSD) GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

De virtuele machines uit de NVv4-serie powered by AMD Radeon Mi25-GPU's . Met NVv4-serie Azure Stack Hub introductie van virtuele machines met gedeeltelijke GPU's. Deze grootte kan worden gebruikt voor gpu-versnelde grafische toepassingen en virtuele bureaubladen. Virtuele NVv4-machines ondersteunen momenteel alleen Windows gastbesturingssysteem.

Grootte vCPU Geheugen: GiB Tijdelijke opslag (SSD) GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Grootte vCPU Geheugen: GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

Overwegingen voor GPU-systeem

  • GPU moet een van deze SKU's zijn: AMD MI-25, Nvidia V100 (en varianten), Nvidia T4.
  • Aantal ondersteunde GPU's per server (1, 2, 3, 4). Voorkeur heeft de volgende: 1, 2 en 4.
  • Alle GPU's moeten exact dezelfde SKU hebben in de schaaleenheid.
  • Alle GPU-hoeveelheden per server moeten hetzelfde zijn in de schaaleenheid.
  • De grootte van de GPU-partitie (voor AMD Mi25) moet hetzelfde zijn voor alle GPU-VM's in de schaaleenheid.

Capaciteitsplanning

De Azure Stack Hub capacity planner is bijgewerkt om GPU-configuraties te ondersteunen. Deze is toegankelijk op https://aka.ms/azstackcapacityplanner.

GPU's toevoegen aan een bestaand Azure Stack Hub

Azure Stack Hub ondersteunt nu het toevoegen van GPU's aan elk bestaand systeem. Hiervoor voert u stop-azurestack uit, voert u de procedure stop-azurestack uit, voegt u GPU's toe en voert u start-azurestack uit totdat deze is voltooid. Als het systeem al GPU's heeft, moeten alle eerder gemaakte GPU-VM's worden gestopt en opnieuw worden opgestart.

Patch en update, FRU-gedrag van VM's

GPU-VM's ondergaan downtime tijdens bewerkingen zoals patch en update (PnU) en hardwarevervanging (FRU) van Azure Stack Hub. De volgende tabel bevat informatie over de status van de VM die tijdens deze activiteiten wordt waargenomen en de handmatige actie die u kunt uitvoeren om deze VM's na de bewerking beschikbaar te maken.

Bewerking PnU - volledige update, OEM-update FRU
VM-status Niet beschikbaar tijdens update. Kan beschikbaar worden gemaakt met handmatige bewerking. VM wordt automatisch online geplaatst na de update. Niet beschikbaar tijdens FRU. Kan beschikbaar worden gemaakt met handmatige bewerking. VM moet weer worden ingesteld na FRU
Handmatige bewerking Als de VM beschikbaar moet worden gesteld tijdens de update en er beschikbare GPU-partities zijn, kan de VM opnieuw worden opgestart vanuit de portal door op de knop Opnieuw opstarten te klikken. Na de update wordt automatisch een back-up van de VM VM is niet beschikbaar tijdens FRU. Als er GPU's beschikbaar zijn, wordt de toewijzing van de VM mogelijk gestopt en opnieuw gestart tijdens FRU. Na de FRU-voltooiing moet de toewijzing van de VM worden gestopt met behulp van de knop Stoppen en weer worden opgestart met behulp van de knop Start.

Installatie van gast stuurprogramma

De volgende PowerShell-cmdlets kunnen worden gebruikt voor de installatie van stuurprogramma's:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Afhankelijk van het besturingssysteem, het type en de connectiviteit van uw Azure Stack Hub GPU-VM, moet u wijzigen met de onderstaande instellingen.

AMD MI25 - Verbonden

De bovenstaande opdracht kan worden gebruikt met het juiste stuurprogrammatype voor AMD. Het artikel INSTALL AMD GPU drivers on N-series VMs running Windows (AMD GPU-stuurprogramma's installeren op VM's uit de NVv4-serie waarop Windows wordt uitgevoerd) bevat instructies voor het installeren van het stuurprogramma voor de AMD RadeonMig MI25 in de VM met NVv4 GPU-P, samen met de stappen voor het controleren van de installatie van stuurprogramma's.

AMD MI25 - Verbinding verbroken

Omdat de extensie het stuurprogramma van een locatie op internet haalt, heeft een VM die is losgekoppeld van het externe netwerk geen toegang tot het stuurprogramma. U kunt het stuurprogramma downloaden via de onderstaande koppeling en uploaden naar een opslagaccount in uw lokale netwerk dat toegankelijk is voor de VM.

URL van stuurprogramma: https://download.microsoft.com/download/3/8/9/3893407b-e8aa-4079-8592-735d7dd1c19a/Radeon-Pro-Software-for-Enterprise-GA.exe

Voeg het bovenstaande stuurprogramma toe aan een opslagaccount en koppel de URL in Instellingen. Deze instellingen moeten worden gebruikt in de cmdlet Set-AzureRMVMExtension .

$Settings = @{
"DriverURL" = <URL to Driver in Storage Account>
}

NVIDIA

NVIDIA-stuurprogramma's moeten worden geïnstalleerd in de virtuele machine voor CUDA- of GRID-workloads met behulp van de GPU.

Use case: graphics/visualization GRID

Voor dit scenario is het gebruik van GRID-stuurprogramma's vereist. GRID-stuurprogramma's kunnen worden gedownload via de NVIDIA Application Hub, mits u over de vereiste licenties hebt. Voor de GRID-stuurprogramma's is ook een GRID-licentieserver met de juiste GRID-licenties vereist voordat u de GRID-stuurprogramma's op de VM kunt gebruiken.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Use case: compute/CUDA - Connected

CUDA-stuurprogramma's hebben geen licentieserver nodig en hebben geen gewijzigde instellingen nodig.

Use case: compute/CUDA - Disconnected

Koppelingen naar NVIDIA CUDA-stuurprogramma's kunnen worden verkregen via de koppeling: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

U moet verwijzen naar enkele URL's voor uw instellingen.

URL Notities
PUBKEY_URL De PUBKEY_URL is de openbare sleutel voor de opslagplaats van het Nvidia-stuurprogramma, niet voor de Linux-VM. Het wordt gebruikt om het stuurprogramma voor Ubuntu te installeren.
DKMS_URL DKMS_URL wordt gebruikt om het pakket op te halen voor het compileren van de Nvidia-kernelmodule op RedHat/CentOs.
DRIVER_URL DRIVER_URL is de URL voor het downloaden van de opslagplaatsgegevens van het Nvidia-stuurprogramma en wordt deze toegevoegd aan de lijst met opslagplaatsen van de Linux-VM.
LIS_URL LIS_URL is de URL voor het downloaden van het Linux Integration Service-pakket voor RedHat/CentOs, Linux Integration Services v4.3 voor Hyper-V en Azure op URL . Dit pakket is standaard niet geïnstalleerd LIS_RHEL_ver is de terugvalkernelversie die moet werken met het Nvidia-stuurprogramma. Deze wordt gebruikt op RedHat/CentOs als de kernel van de Linux-VM niet compatibel is met het aangevraagde Nvidia-stuurprogramma.

Voeg de URL's toe aan uw instellingen.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Volgende stappen