GPU (Graphics Processing Unit) virtuele machine (VM) op Azure Stack Hub
Van toepassing op: Azure Stack Hub geïntegreerde systemen
In dit artikel wordt beschreven welke GPU-modellen (Graphics Processing Unit) worden ondersteund op een Azure Stack Hub geïntegreerd systeem. U kunt ook instructies vinden voor het installeren van de stuurprogramma's die worden gebruikt met de GPU's. GPU-ondersteuning in Azure Stack Hub maakt oplossingen mogelijk, zoals kunstmatige intelligentie, training, deferentie en gegevensvisualisatie. De AMD Radeon Wilt MI25 kan worden gebruikt ter ondersteuning van grafisch-intensieve toepassingen, zoals Autodesk AutoCAD.
U kunt kiezen uit drie GPU-modellen. Ze zijn beschikbaar in gpu's van NVIDIA V100, NVIDIA T4 en AMD MI25. Deze fysieke GPU's worden als volgt uitgelijnd met de volgende typen virtuele machines uit de Azure N-serie:
Waarschuwing
GPU-VM's worden niet ondersteund in deze release. U moet een upgrade uitvoeren naar Azure Stack Hub 2005 of hoger. Daarnaast moet uw Azure Stack Hub hardware fysieke GPU's hebben.
NCv3
VM's uit de NCv3-serie powered by NVIDIA Tesla V100 GPU's. Klanten kunnen profiteren van deze bijgewerkte GPU's voor traditionele HPC-workloads, zoals reservoirmodelleren, DNA-sequencing, analyse van voedsel, Monte Carlo-simulaties en andere.
| Grootte | vCPU | Geheugen: GiB | Tijdelijke opslag (SSD) GiB | GPU | GPU-geheugen: GiB | Max. aantal gegevensschijven | Max. aantal NIC's |
|---|---|---|---|---|---|---|---|
| Standard_NC6s_v3 | 6 | 112 | 736 | 1 | 16 | 12 | 4 |
| Standard_NC12s_v3 | 12 | 224 | 1474 | 2 | 32 | 24 | 8 |
| Standard_NC24s_v3 | 24 | 448 | 2948 | 4 | 64 | 32 | 8 |
NVv4
De virtuele machines uit de NVv4-serie powered by AMD Radeon Mi25-GPU's . Met NVv4-serie Azure Stack Hub introductie van virtuele machines met gedeeltelijke GPU's. Deze grootte kan worden gebruikt voor gpu-versnelde grafische toepassingen en virtuele bureaubladen. Virtuele NVv4-machines ondersteunen momenteel alleen Windows gastbesturingssysteem.
| Grootte | vCPU | Geheugen: GiB | Tijdelijke opslag (SSD) GiB | GPU | GPU-geheugen: GiB | Max. aantal gegevensschijven | Max. aantal NIC's |
|---|---|---|---|---|---|---|---|
| Standard_NV4as_v4 | 4 | 14 | 88 | 1/8 | 2 | 4 | 2 |
| Standard_NV8as_v4 | 8 | 28 | 176 | 1/4 | 4 | 8 | 4 |
| Standard_NV16as_v4 | 16 | 56 | 352 | 1/2 | 8 | 16 | 8 |
| Standard_NV32as_v4 | 32 | 112 | 704 | 1 | 16 | 32 | 8 |
NCasT4_v3
| Grootte | vCPU | Geheugen: GiB | GPU | GPU-geheugen: GiB | Max. aantal gegevensschijven | Max. aantal NIC's |
|---|---|---|---|---|---|---|
| Standard_NC4as_T4_v3 | 4 | 28 | 1 | 16 | 8 | 4 |
| Standard_NC8as_T4_v3 | 8 | 56 | 1 | 16 | 16 | 8 |
| Standard_NC16as_T4_v3 | 16 | 110 | 1 | 16 | 32 | 8 |
| Standard_NC64as_T4_v3 | 64 | 440 | 4 | 64 | 32 | 8 |
Overwegingen voor GPU-systeem
- GPU moet een van deze SKU's zijn: AMD MI-25, Nvidia V100 (en varianten), Nvidia T4.
- Aantal ondersteunde GPU's per server (1, 2, 3, 4). Voorkeur heeft de volgende: 1, 2 en 4.
- Alle GPU's moeten exact dezelfde SKU hebben in de schaaleenheid.
- Alle GPU-hoeveelheden per server moeten hetzelfde zijn in de schaaleenheid.
- De grootte van de GPU-partitie (voor AMD Mi25) moet hetzelfde zijn voor alle GPU-VM's in de schaaleenheid.
Capaciteitsplanning
De Azure Stack Hub capacity planner is bijgewerkt om GPU-configuraties te ondersteunen. Deze is toegankelijk op https://aka.ms/azstackcapacityplanner.
GPU's toevoegen aan een bestaand Azure Stack Hub
Azure Stack Hub ondersteunt nu het toevoegen van GPU's aan elk bestaand systeem. Hiervoor voert u stop-azurestack uit, voert u de procedure stop-azurestack uit, voegt u GPU's toe en voert u start-azurestack uit totdat deze is voltooid. Als het systeem al GPU's heeft, moeten alle eerder gemaakte GPU-VM's worden gestopt en opnieuw worden opgestart.
Patch en update, FRU-gedrag van VM's
GPU-VM's ondergaan downtime tijdens bewerkingen zoals patch en update (PnU) en hardwarevervanging (FRU) van Azure Stack Hub. De volgende tabel bevat informatie over de status van de VM die tijdens deze activiteiten wordt waargenomen en de handmatige actie die u kunt uitvoeren om deze VM's na de bewerking beschikbaar te maken.
| Bewerking | PnU - volledige update, OEM-update | FRU |
|---|---|---|
| VM-status | Niet beschikbaar tijdens update. Kan beschikbaar worden gemaakt met handmatige bewerking. VM wordt automatisch online geplaatst na de update. | Niet beschikbaar tijdens FRU. Kan beschikbaar worden gemaakt met handmatige bewerking. VM moet weer worden ingesteld na FRU |
| Handmatige bewerking | Als de VM beschikbaar moet worden gesteld tijdens de update en er beschikbare GPU-partities zijn, kan de VM opnieuw worden opgestart vanuit de portal door op de knop Opnieuw opstarten te klikken. Na de update wordt automatisch een back-up van de VM | VM is niet beschikbaar tijdens FRU. Als er GPU's beschikbaar zijn, wordt de toewijzing van de VM mogelijk gestopt en opnieuw gestart tijdens FRU. Na de FRU-voltooiing moet de toewijzing van de VM worden gestopt met behulp van de knop Stoppen en weer worden opgestart met behulp van de knop Start. |
Installatie van gast stuurprogramma
De volgende PowerShell-cmdlets kunnen worden gebruikt voor de installatie van stuurprogramma's:
$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"
Set-AzureRmVMExtension -Location $Location `
-Publisher $driverPublisher `
-ExtensionType $driverType `
-TypeHandlerVersion $driverVersion `
-VMName $VmName `
-ResourceGroupName $ResourceGroupName `
-Name $driverName `
-Settings $Settings ` # If no settings are set, omit this parameter
-Verbose
Afhankelijk van het besturingssysteem, het type en de connectiviteit van uw Azure Stack Hub GPU-VM, moet u wijzigen met de onderstaande instellingen.
AMD MI25 - Verbonden
De bovenstaande opdracht kan worden gebruikt met het juiste stuurprogrammatype voor AMD. Het artikel INSTALL AMD GPU drivers on N-series VMs running Windows (AMD GPU-stuurprogramma's installeren op VM's uit de NVv4-serie waarop Windows wordt uitgevoerd) bevat instructies voor het installeren van het stuurprogramma voor de AMD RadeonMig MI25 in de VM met NVv4 GPU-P, samen met de stappen voor het controleren van de installatie van stuurprogramma's.
AMD MI25 - Verbinding verbroken
Omdat de extensie het stuurprogramma van een locatie op internet haalt, heeft een VM die is losgekoppeld van het externe netwerk geen toegang tot het stuurprogramma. U kunt het stuurprogramma downloaden via de onderstaande koppeling en uploaden naar een opslagaccount in uw lokale netwerk dat toegankelijk is voor de VM.
URL van stuurprogramma: https://download.microsoft.com/download/3/8/9/3893407b-e8aa-4079-8592-735d7dd1c19a/Radeon-Pro-Software-for-Enterprise-GA.exe
Voeg het bovenstaande stuurprogramma toe aan een opslagaccount en koppel de URL in Instellingen. Deze instellingen moeten worden gebruikt in de cmdlet Set-AzureRMVMExtension .
$Settings = @{
"DriverURL" = <URL to Driver in Storage Account>
}
NVIDIA
NVIDIA-stuurprogramma's moeten worden geïnstalleerd in de virtuele machine voor CUDA- of GRID-workloads met behulp van de GPU.
Use case: graphics/visualization GRID
Voor dit scenario is het gebruik van GRID-stuurprogramma's vereist. GRID-stuurprogramma's kunnen worden gedownload via de NVIDIA Application Hub, mits u over de vereiste licenties hebt. Voor de GRID-stuurprogramma's is ook een GRID-licentieserver met de juiste GRID-licenties vereist voordat u de GRID-stuurprogramma's op de VM kunt gebruiken.
$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="GRID"
}
Use case: compute/CUDA - Connected
CUDA-stuurprogramma's hebben geen licentieserver nodig en hebben geen gewijzigde instellingen nodig.
Use case: compute/CUDA - Disconnected
Koppelingen naar NVIDIA CUDA-stuurprogramma's kunnen worden verkregen via de koppeling: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json
Windows:
$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="CUDA"
}
Linux:
U moet verwijzen naar enkele URL's voor uw instellingen.
| URL | Notities |
|---|---|
| PUBKEY_URL | De PUBKEY_URL is de openbare sleutel voor de opslagplaats van het Nvidia-stuurprogramma, niet voor de Linux-VM. Het wordt gebruikt om het stuurprogramma voor Ubuntu te installeren. |
| DKMS_URL | DKMS_URL wordt gebruikt om het pakket op te halen voor het compileren van de Nvidia-kernelmodule op RedHat/CentOs. |
| DRIVER_URL | DRIVER_URL is de URL voor het downloaden van de opslagplaatsgegevens van het Nvidia-stuurprogramma en wordt deze toegevoegd aan de lijst met opslagplaatsen van de Linux-VM. |
| LIS_URL | LIS_URL is de URL voor het downloaden van het Linux Integration Service-pakket voor RedHat/CentOs, Linux Integration Services v4.3 voor Hyper-V en Azure op URL . Dit pakket is standaard niet geïnstalleerd LIS_RHEL_ver is de terugvalkernelversie die moet werken met het Nvidia-stuurprogramma. Deze wordt gebruikt op RedHat/CentOs als de kernel van de Linux-VM niet compatibel is met het aangevraagde Nvidia-stuurprogramma. |
Voeg de URL's toe aan uw instellingen.
$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}