Delen via


GPU (Graphics Processing Unit) virtuele machine (VM) op Azure Stack Hub

In dit artikel wordt beschreven welke GPU-modellen (Graphics Processing Unit) worden ondersteund op een geïntegreerd Azure Stack Hub-systeem. U vindt ook instructies voor het installeren van de stuurprogramma's die worden gebruikt met de GPU's. GPU-ondersteuning in Azure Stack Hub maakt oplossingen mogelijk, zoals kunstmatige intelligentie, training, deductie en gegevensvisualisatie. De AMD Amd Amd Instinct MI25 kan worden gebruikt ter ondersteuning van grafisch intensieve toepassingen zoals Autodesk AutoCAD.

U kunt kiezen uit drie GPU-modellen. Ze zijn beschikbaar in NVIDIA V100, NVIDIA T4 en AMD MI25 GPU's. Deze fysieke GPU's zijn als volgt afgestemd op de volgende typen virtuele machines (VM's) uit de Azure N-serie:

Waarschuwing

GPU-VM's worden niet ondersteund in deze release. U moet een upgrade uitvoeren naar Azure Stack Hub 2005 of hoger. Bovendien moet uw Azure Stack Hub-hardware fysieke GPU's hebben.

NCv3

VM's uit de NCv3-serie worden aangedreven door NVIDIA Tesla V100 GPU's. Klanten kunnen profiteren van deze bijgewerkte GPU's voor traditionele HPC-workloads, zoals reservoirmodellering, DNA-sequencing, eiwitanalyse, Monte Carlo-simulaties en andere.

Tekengrootte vCPU Geheugen: GiB Tijdelijke opslag (SSD) GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

De virtuele machines uit de NVv4-serie worden aangedreven door AMD Amd Instinct MI25 GPU's. Met de NVv4-serie introduceert Azure Stack Hub virtuele machines met gedeeltelijke GPU's. Deze grootte kan worden gebruikt voor gpu versnelde grafische toepassingen en virtuele bureaubladen. Virtuele machines van NVv4 ondersteunen momenteel alleen het Windows-gastbesturingssysteem.

Tekengrootte vCPU Geheugen: GiB Tijdelijke opslag (SSD) GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Tekengrootte vCPU Geheugen: GiB GPU GPU-geheugen: GiB Max. aantal gegevensschijven Max. aantal NIC's
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

De NC_A100 serie VM's worden aangedreven door NVIDIA Ampere A100 GPU's, de opvolger van de Tesla V100 GPU's. U kunt profiteren van deze bijgewerkte GPU's voor traditionele HPC-workloads, zoals reservoirmodellering, DNA-sequencing, eiwitanalyse, Monte Carlo-simulaties en andere.

Tekengrootte vCPU Geheugen: GiB Tijdelijke opslag (GiB) Max. aantal gegevensschijven GPU GPU-geheugen GiB Max. aantal NIC's
Standard_NC24ads_A100_v4 24 220 1123 12 1 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

Overwegingen voor GPU-systeem

  • GPU moet een van deze SKU's zijn: AMD MI-25, Nvidia V100 (en varianten), Nvidia T4.
  • Aantal GPU's per server dat wordt ondersteund (1, 2, 3, 4). Voorkeur is: 1, 2 en 4.
  • Alle GPU's moeten exact dezelfde SKU in de schaaleenheid hebben.
  • Alle GPU-hoeveelheden per server moeten hetzelfde zijn in de schaaleenheid.
  • De GPU-partitiegrootte (voor AMD Mi25) moet op alle GPU-VM's in de schaaleenheid hetzelfde zijn.

Capaciteitsplanning

De Azure Stack Hub-capaciteitsplanner is bijgewerkt ter ondersteuning van GPU-configuraties. Het is toegankelijk op https://aka.ms/azstackcapacityplanner.

GPU's toevoegen aan een bestaande Azure Stack Hub

Azure Stack Hub biedt nu ondersteuning voor het toevoegen van GPU's aan een bestaand systeem. Hiervoor voert u stop-azurestack uit, voert u de procedure van stop-azurestack uit, voegt u GPU's toe en voert u start-azurestack uit totdat deze is voltooid. Als het systeem al GPU's had, moeten eerder gemaakte GPU-VM's worden gestopt en opnieuw worden opgestart.

Patch en update, FRU-gedrag van VM's

GPU-VM's ondergaan downtime tijdens bewerkingen zoals patch en update (PnU) en hardwarevervanging (FRU) van Azure Stack Hub. In de volgende tabel wordt de status van de VIRTUELE machine behandeld zoals tijdens deze activiteiten is waargenomen en de handmatige actie die u kunt uitvoeren om deze VM's na de bewerking beschikbaar te maken.

Operation PnU - Volledige update, OEM-update FRU
VM-status Niet beschikbaar tijdens de update. Kan beschikbaar worden gesteld met handmatige bediening. VM is automatisch online na het bijwerken. Niet beschikbaar tijdens FRU. Kan beschikbaar worden gesteld met handmatige bediening. De VM moet worden teruggezet na FRU
Handmatige bewerking Als de VIRTUELE machine beschikbaar moet worden gesteld tijdens de update, als er beschikbare GPU-partities zijn, kan de VIRTUELE machine opnieuw worden opgestart vanuit de portal door op de knop Opnieuw opstarten te klikken. Vm wordt automatisch na de update teruggezet VM is niet beschikbaar tijdens FRU. Als er gpu's beschikbaar zijn, kan de toewijzing van vm's worden gestopt en opnieuw worden opgestart tijdens FRU. Na voltooiing van FRU moet de toewijzing van de VIRTUELE machine worden gestopt met behulp van de knop Stoppen en een back-up maken met behulp van de knop Start .

Installatie van gaststuurprogramma

De volgende PowerShell-cmdlets kunnen worden gebruikt voor installatie van stuurprogramma's:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Afhankelijk van het besturingssysteem, het type en de connectiviteit van uw GPU-VM van Azure Stack Hub, moet u deze wijzigen met de onderstaande instellingen.

AMD MI25

De versie van het gaststuurprogramma moet overeenkomen met de Versie van Azure Stack Hub, ongeacht de connectiviteitsstatus. Het gebruik van nieuwere versies die niet zijn afgestemd op de Azure Stack Hub-versie, kan bruikbaarheidsproblemen veroorzaken.

Versie van Azure Stack Hub AMD Guest Driver
2206 21.Q2-1, 20.Q4-1
2108 21.Q2-1, 20.Q4-1
2102 21.Q2-1, 20.Q4-1

Connected

Gebruik het PowerShell-script in de vorige sectie met het juiste stuurprogrammatype voor AMD. Het artikel AMD GPU-stuurprogramma's installeren op VM's uit de N-serie waarop Windows wordt uitgevoerd, bevat instructies voor het installeren van het stuurprogramma voor de AMD Amd Instinct MI25 in de VM met NVv4 GPU-P, samen met stappen voor het controleren van de installatie van stuurprogramma's.

Ontkoppeld

Omdat de extensie het stuurprogramma van een locatie op internet haalt, heeft een VM die geen verbinding heeft met het externe netwerk, geen toegang tot het stuurprogramma. U kunt het stuurprogramma uit de vorige tabel downloaden en uploaden naar een opslagaccount in uw lokale netwerk dat toegankelijk is voor de virtuele machine.

Voeg het AMD-stuurprogramma toe aan een opslagaccount en geef de URL op naar dat account in Settings. Deze instellingen moeten worden gebruikt in de cmdlet Set-AzureRMVMExtension . Voorbeeld:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVIDIA

NVIDIA-stuurprogramma's moeten worden geïnstalleerd in de virtuele machine voor CUDA- of GRID-workloads met behulp van de GPU.

Use case: graphics/visualization GRID

Voor dit scenario is het gebruik van GRID-stuurprogramma's vereist. GRID-stuurprogramma's kunnen worden gedownload via de NVIDIA Application Hub, mits u over de vereiste licenties beschikt. Voor de GRID-stuurprogramma's is ook een GRID-licentieserver met de juiste GRID-licenties vereist voordat u de GRID-stuurprogramma's op de VIRTUELE machine gebruikt.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Use case: compute/CUDA - Verbinding maken ed

CUDA-stuurprogramma's hebben geen licentieserver nodig en hebben geen gewijzigde instellingen nodig.

Use case: compute/CUDA - Verbinding verbroken

Koppelingen naar NVIDIA CUDA-stuurprogramma's kunnen worden verkregen via de koppeling: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

U moet verwijzen naar enkele URL's voor uw instellingen.

URL Opmerkingen
PUBKEY_URL De PUBKEY_URL is de openbare sleutel voor de Nvidia-stuurprogrammaopslagplaats niet voor de Linux-VM. Het wordt gebruikt om stuurprogramma voor Ubuntu te installeren.
DRIVER_URL DRIVER_URL is de URL voor het downloaden van de opslagplaatsinformatie van het Nvidia-stuurprogramma en deze wordt toegevoegd aan de lijst met opslagplaatsen van de Linux-VM.

Voeg de URL's toe aan uw instellingen.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Volgende stappen