Grafikus processzorral (GPU) rendelkező virtuális gép az Azure Stack Hubon

Figyelemfelhívás

Ez a cikk a CentOS linuxos disztribúcióra hivatkozik, amely közel áll az élettartam (EOL) állapotához. Fontolja meg a használatát, és ennek megfelelően tervezze meg. További információ: CentOS End Of Life útmutató.

Ez a cikk azt ismerteti, hogy mely grafikus feldolgozási egységek (GPU-k) modelljei támogatottak az Azure Stack Hub integrált rendszerén. A GPU-khoz használt illesztőprogramok telepítésére vonatkozó utasításokat is megtalálja. Az Azure Stack Hub GPU-támogatása olyan megoldásokat tesz lehetővé, mint a mesterséges intelligencia, a betanítás, a következtetés és az adatvizualizáció. Az AMD Radeon Instinct MI25 olyan grafikus alkalmazások támogatására használható, mint az Autodesk AutoCAD.

Három GPU-modell közül választhat. Nvidia V100, NVIDIA T4 és AMD MI25 GPU-kban érhetők el. Ezek a fizikai GPU-k az alábbi Azure N sorozatú virtuális gépek (VM-ek) típusaihoz igazodnak az alábbiak szerint:

Figyelmeztetés

Ebben a kiadásban a GPU virtuális gépek nem támogatottak. Frissítenie kell az Azure Stack Hub 2005-ös vagy újabb verziójára. Emellett az Azure Stack Hub-hardvernek fizikai GPU-kkal kell rendelkeznie.

NCv3

Az NCv3 sorozatú virtuális gépeket NVIDIA Tesla V100 GPU-k működtetik. Az ügyfelek kihasználhatják ezeket a frissített GPU-kat a hagyományos HPC számítási feladatokhoz, például tározómodellezéshez, DNS-szekvenáláshoz, fehérjeelemzéshez, Monte Carlo-szimulációkhoz és más feladatokhoz.

Méret vCPU Memória: GiB Ideiglenes tárterület (SSD) GiB GPU GPU-memória: GiB Adatlemezek max. száma Hálózati adapterek maximális száma
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

Az NVv4 sorozatú virtuális gépeket AMD Radeon Instinct MI25 GPU-k működtetik. Az NVv4 sorozattal az Azure Stack Hub részleges GPU-kkal rendelkező virtuális gépeket vezet be. Ez a méret GPU-val gyorsított grafikus alkalmazásokhoz és virtuális asztalokhoz használható. Az NVv4 virtuális gépek jelenleg csak a Windows vendég operációs rendszert támogatják.

Méret vCPU Memória: GiB Ideiglenes tárterület (SSD) GiB GPU GPU-memória: GiB Adatlemezek max. száma Hálózati adapterek maximális száma
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Méret vCPU Memória: GiB GPU GPU-memória: GiB Adatlemezek max. száma Hálózati adapterek maximális száma
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

A NC_A100 sorozatú virtuális gépeket NVIDIA Ampere A100 GPU-k működtetik, a Tesla V100 GPU-k utódja. Ezeket a frissített GPU-kat olyan hagyományos HPC számítási feladatokhoz használhatja ki, mint a tározómodellezés, a DNS-szekvenálás, a fehérjeelemzés, a Monte Carlo-szimulációk és más feladatok.

Méret vCPU Memória: GiB Ideiglenes tárterület (GiB) Adatlemezek max. száma GPU GPU-memória GiB Hálózati adapterek maximális száma
Standard_NC24ads_A100_v4 24 220 1123 12 1 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

GPU-rendszerekkel kapcsolatos szempontok

  • A GPU-nak a következő termékváltozatok egyikének kell lennie: AMD MI-25, Nvidia V100 (és változatok), Nvidia T4.
  • Támogatott gpu-k száma kiszolgálónként (1, 2, 3, 4). Előnyben részesítettek: 1, 2 és 4.
  • A skálázási egységben minden GPU-nak pontosan azonos termékváltozatúnak kell lennie.
  • A kiszolgálónkénti ÖSSZES GPU-mennyiségnek azonosnak kell lennie a skálázási egységben.
  • A GPU-partíció méretének (AMD Mi25 esetén) azonosnak kell lennie a skálázási egység összes GPU-virtuális gépén.

Kapacitástervezés

Az Azure Stack Hub kapacitástervezője frissült a GPU-konfigurációk támogatásához. A(z) webhelyen https://aka.ms/azstackcapacityplannerérhető el.

GPU-k hozzáadása meglévő Azure Stack Hubhoz

Az Azure Stack Hub mostantól támogatja gpu-k hozzáadását bármely meglévő rendszerhez. Ehhez hajtsa végre a stop-azurestack parancsot, futtassa végig a stop-azurestack eljárást, adjon hozzá GPU-kat, majd futtassa a start-azurestack parancsot a befejezésig. Ha a rendszer már rendelkezik GPU-kkal, akkor a korábban létrehozott GPU-beli virtuális gépeket le kell állítani, majd újra kell indítani.

Javítás és frissítés, virtuális gépek FRU-viselkedése

A GPU-alapú virtuális gépek leállnak az olyan műveletek során, mint a javítás és frissítés (PnU) és az Azure Stack Hub hardvercseréje (FRU). Az alábbi táblázat a virtuális gép ezen tevékenységek során megfigyelt állapotát és azt a manuális műveletet ismerteti, ameddig elérhetővé teheti ezeket a virtuális gépeket a művelet után.

Művelet PnU – Teljes frissítés, OEM-frissítés FRU
Virtuális gép állapota A frissítés során nem érhető el. Manuális művelettel elérhetővé tehető. A virtuális gép automatikusan online állapotba kerül a frissítés után. Nem érhető el az FRU során. Manuális művelettel elérhetővé tehető. A virtuális gépet vissza kell állítani az FRU után
Manuális művelet Ha a frissítés során elérhetővé kell tenni a virtuális gépet, ha vannak elérhető GPU-partíciók, a virtuális gépet az Újraindítás gombra kattintva lehet újraindítani a portálról. A virtuális gép automatikusan biztonsági másolatot készít a frissítés után A virtuális gép nem érhető el az FRU során. Ha rendelkezésre állnak GPU-k, előfordulhat, hogy a virtuális gép leáll, majd újraindul az FRU során. Az FRU befejezése után a virtuális gépet le kell állítani a Leállítás gombbal, és a Start gomb használatával kell elindítani a biztonsági mentést.

Vendégillesztő telepítése

Az illesztőprogramok telepítéséhez a következő PowerShell-parancsmagok használhatók:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Az Azure Stack Hub GPU virtuális gép operációs rendszerétől, típusától és kapcsolatától függően módosítania kell az alábbi beállításokat.

AMD MI25

A vendégillesztő verziójának a kapcsolati állapottól függetlenül meg kell egyeznie az Azure Stack Hub verziójával. Az Azure Stack Hub verziójához nem igazodó újabb verziók használata használhatósági problémákat okozhat.

Az Azure Stack Hub verziója AMD vendégillesztő
2206 21.Q2-1, 20.Q4-1
2108 21.Q2-1, 20.Q4-1
2102 21.Q2-1, 20.Q4-1

Csatlakozva

Használja az előző szakaszban található PowerShell-szkriptet az AMD megfelelő illesztőprogram-típusával. Az AMD GPU-illesztőprogramok telepítése Windows rendszerű N sorozatú virtuális gépekre című cikk útmutatást nyújt az AMD Radeon Instinct MI25 illesztőprogramjának az NVv4 GPU-P-kompatibilis virtuális gépen belüli telepítéséhez, valamint az illesztőprogram telepítésének ellenőrzéséhez szükséges lépésekről.

Leválasztott

Mivel a bővítmény lekéri az illesztőprogramot egy internetes helyről, a külső hálózatról leválasztott virtuális gép nem tud hozzáférni. Letöltheti az illesztőprogramot az előző táblából, és feltöltheti a helyi hálózat egy olyan tárfiókjába, amely elérhető a virtuális gép számára.

Adja hozzá az AMD-illesztőt egy tárfiókhoz, és adja meg a fiók URL-címét a fájlban Settings. Ezeket a beállításokat a Set-AzureRMVMExtension parancsmagban kell használni. Például:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVIDIA

Az NVIDIA-illesztőprogramokat a virtuális gépen kell telepíteni CUDA vagy GRID számítási feladatokhoz a GPU használatával.

Használati eset: grafikus/vizualizációs RÁCS

Ez a forgatókönyv a GRID-illesztőprogramok használatát igényli. A GRID-illesztőprogramok az NVIDIA Application Hubon keresztül tölthetők le, feltéve, hogy rendelkezik a szükséges licencekkel. A GRID-illesztőknek megfelelő GRID-licenccel rendelkező GRID-licenckiszolgálóra is szükségük van, mielőtt a GRID-illesztőprogramokat használnák a virtuális gépen.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Használati eset: compute/CUDA – Csatlakoztatva

A CUDA-illesztőprogramoknak nincs szükségük licenckiszolgálóra, és nem kell módosítani a beállításokat.

Használati eset: compute/CUDA – Leválasztva

Az NVIDIA CUDA-illesztőprogramokra mutató hivatkozások a következő hivatkozással szerezhetőek be: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

A beállításokhoz hivatkoznia kell néhány URL-címre.

URL-cím Jegyzetek
PUBKEY_URL A PUBKEY_URL az Nvidia illesztőprogram-adattárának nyilvános kulcsa, nem a Linux rendszerű virtuális géphez. Az Ubuntu illesztőprogramjának telepítéséhez használatos.
DKMS_URL DKMS_URL a csomag lekérésére szolgál az Nvidia kernelmodul RedHat/CentOs rendszeren való fordításához.
DRIVER_URL DRIVER_URL az Nvidia-illesztőprogram adattáradatainak letöltéséhez szükséges URL-cím, amely bekerül a Linux rendszerű virtuális gép adattárainak listájába.
LIS_URL LIS_URL a RedHat/CentOs Linux Integration Service-csomag letöltésének URL-címe, a Hyper-V-hez és az Azure-hoz készült Linux Integration Services 4.3-at tartalmazó URL-címenhttps://www.microsoft.com/download/details.aspx?id=55106 alapértelmezés szerint nincs telepítve, LIS_RHEL_ver az Nvidia-illesztővel használható tartalék kernelverzió. RedHat/CentOs rendszeren használatos, ha a Linux rendszerű virtuális gép kernele nem kompatibilis a kért Nvidia-illesztőprogrammal.

Adja hozzá az URL-címeket a beállításokhoz.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Következő lépések