Virtuální počítač gpu (Graphics Processing Unit) na Azure Stack Hub

Platí pro: Azure Stack Hub integrované systémy

Tento článek popisuje, které modely grafických procesorů (GPU) jsou podporované v Azure Stack Hub systému. Najdete zde také pokyny k instalaci ovladačů používaných s GPU. Podpora GPU v Azure Stack Hub umožňuje řešení, jako je umělá inteligence, trénování, odvozování a vizualizace dat. K podpoře graficky náročných aplikací, jako je Například Autodesk AutoCAD, je možné použít AMD Předpovědí MI25.

Můžete si vybrat ze tří modelů GPU. Jsou k dispozici v grafických procesorech NVIDIA V100, NVIDIA T4 a AMD MI25. Tyto fyzické grafické procesory (GPU) jsou v souladu s následujícími typy virtuálních počítačů Azure N-Series:

Upozornění

Virtuální počítače s GPU nejsou v této verzi podporované. Budete muset upgradovat na verzi Azure Stack Hub 2005 nebo novější. Kromě toho váš hardware Azure Stack Hub fyzický GPU.

NCv3

Virtuální počítače řady NCv3 využívají grafické procesory NVIDIA Tesla V100. Zákazníci mohou využít těchto aktualizovaných GPU pro tradiční úlohy HPC, jako je modelování zásob zásob, sekvenování DNA, analýza proteinů, simulace Typu Monte Carlo a další.

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

Virtuální počítače řady NVv4 využívají grafické procesory AMD ADX MI25. S NVv4-series Azure Stack Hub představuje virtuální počítače s částečnými GPU. Tuto velikost lze použít pro grafické aplikace s akcelerované grafickými procesory a virtuální plochy. Virtuální počítače NVv4 v současné době podporují Windows hosta operačního systému.

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Velikost Virtuální procesory Paměť: GiB GPU Paměť GPU: GiB Max. datových disků Maximální počet síťových karet
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

Systémové požadavky GPU

  • GPU musí být jedna z těchto SKU: AMD MI-25, NVIDIA V100 (a variant), NVIDIA T4.
  • Počet podporovaných GPU na server (1, 2, 3, 4). Preferované jsou: 1, 2 a 4.
  • Všechny GPU musí být v rámci jednotky škálování přesnou stejnou SKU.
  • Všechna množství GPU na jeden server musí být stejná v celé jednotce škálování.
  • Velikost oddílu GPU (pro AMD Mi25) musí být stejná v celém virtuálním počítači GPU na jednotce škálování.

Plánování kapacity

Plánovač kapacity centra Azure Stack byl aktualizován tak, aby podporoval konfiguraci GPU. Je dostupná na https://aka.ms/azstackcapacityplanner .

Přidání GPU v existujícím centru Azure Stack

Centrum Azure Stack nyní podporuje přidávání GPU do libovolného existujícího systému. Provedete to spuštěním rutiny Stop-azurestack, spuštěním rutiny Stop-azurestack, přidáním GPU a pak spuštěním rutiny Start-azurestack až do dokončení. Pokud již systém obsahuje GPU, bude nutné, aby všechny dříve vytvořené virtuální počítače GPU byly zastaveny a pak restartovány.

Oprava a aktualizace, chování funkce FRU virtuálních počítačů

K virtuálním počítačům GPU dojde během operací, jako je třeba oprava a aktualizace (PnU) a náhrada hardwaru (FRU) centra Azure Stack. Následující tabulka popisuje stav virtuálního počítače zjištěného během těchto aktivit a ruční akce, které můžete provést, aby byly tyto virtuální počítače po operaci k dispozici.

Operace PnU – úplná aktualizace, OEM Update JEDNOTKA
Stav virtuálního počítače Během aktualizace není k dispozici. Dá se zpřístupnit s ruční operací. Virtuální počítač je automaticky online po aktualizaci. Během jednotky FRU není k dispozici. Dá se zpřístupnit s ruční operací. Virtuální počítač se musí přenést po instalaci jednotky FRU.
Ruční operace Pokud je potřeba virtuální počítač zpřístupnit během aktualizace, pokud jsou dostupné oddíly GPU, můžete virtuální počítač restartovat z portálu kliknutím na tlačítko restartovat . Virtuální počítač automaticky provede zálohování po aktualizaci. Virtuální počítač není během jednotky FRU k dispozici. Pokud máte dostupné GPU, může být virtuální počítač v průběhu jednotky FRU zastaven a restartován. Po dokončení operace FRU se musí virtuální počítač zastavit a zrušit jeho přidělení pomocí tlačítka zastavit a spustit zálohování pomocí tlačítka Start .

Instalace ovladače hosta

Pro instalaci ovladačů lze použít následující rutiny PowerShellu:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

V závislosti na operačním systému zadejte a nasaďte připojení k virtuálnímu počítači GPU služby Azure Stack hub, budete ho muset upravit pomocí následujících nastavení.

AMD MI25 – připojeno

Výše uvedený příkaz se dá použít s vhodným typem ovladače pro procesory AMD. článek instalace ovladačů amd GPU na virtuálních počítačích řady N-series se systémem Windows poskytuje pokyny k instalaci ovladače pro AMD Radeon Instinct MI25 uvnitř virtuálního počítače NVv4 GPU – P s postupem, jak ověřit instalaci ovladače.

AMD MI25 – odpojeno

Vzhledem k tomu, že rozšíření přebírá ovladač z umístění na internetu, virtuální počítač, který je odpojený od externí sítě, k němu nemá přístup. Ovladač si můžete stáhnout z následujícího odkazu a odeslat ho do účtu úložiště ve vaší místní síti, který je přístupný pro virtuální počítač.

Adresa URL ovladače: https://download.microsoft.com/download/3/8/9/3893407b-e8aa-4079-8592-735d7dd1c19a/Radeon-Pro-Software-for-Enterprise-GA.exe

přidání výše uvedeného ovladače do účtu úložiště a připojení adresy URL v Nastavení. Tato nastavení bude nutné použít v rutině set-AzureRMVMExtension .

$Settings = @{
"DriverURL" = <URL to Driver in Storage Account>
}

GRAF

Ovladače NVIDIA musí být nainstalované v rámci virtuálního počítače pro úlohy CUDA nebo GRIDu pomocí GPU.

Případ použití: grafika/vizualizace mřížky

Tento scénář vyžaduje použití ovladačů mřížky. Ovladače mřížky je možné stáhnout prostřednictvím centra aplikací NVIDIA, pokud máte požadované licence. Ovladače mřížky také vyžadují licenční server s MŘÍŽKou s příslušnými licencemi k mřížce před použitím ovladačů mřížky na virtuálním počítači.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Případ použití: COMPUTE/CUDA – připojeno

Ovladače CUDA nepotřebují licenční server a nepotřebují měnit nastavení.

Případ použití: COMPUTE/CUDA – odpojeno

Odkazy na ovladače NVIDIA CUDA můžete získat pomocí tohoto odkazu: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux

Pro vaše nastavení budete muset odkazovat na některé adresy URL.

URL Poznámky
PUBKEY_URL PUBKEY_URL je veřejný klíč pro úložiště ovladačů NVIDIA, které není pro virtuální počítač se systémem Linux. Slouží k instalaci ovladače pro Ubuntu.
DKMS_URL DKMS_URL slouží k získání balíčku pro zkompilování modulu jádra NVIDIA na RedHat/CentOs.
DRIVER_URL DRIVER_URL je adresa URL pro stažení informací o úložišti ovladače NVIDIA a přidá se do seznamu úložišť na virtuálním počítači Linux.
LIS_URL LIS_URL je adresa URL pro stažení balíčku integrační služby pro Linux pro RedHat/CentOs, Linux Integration Services V 4.3 pro Hyper-V a Azure na adrese URL ve výchozím nastavení není nainstalovaná LIS_RHEL_ver je záložní verze jádra, která by měla fungovat s ovladačem NVIDIA. Používá se na RedHat/CentOs, pokud jádro virtuálního počítače se systémem Linux není kompatibilní s požadovaným ovladačem NVIDIA.

Přidejte adresy URL do svého nastavení.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Další kroky