Azure Stack Hub'da grafik işleme birimi (GPU) sanal makinesi (VM)

Dikkat

Bu makalede, Kullanım Süresi Sonu (EOL) durumuna yakın bir Linux dağıtımı olan CentOS'a başvuruda bulunur. Lütfen kullanımınızı göz önünde bulundurun ve buna göre planlayın. Daha fazla bilgi için bkz. CentOS Kullanım Süresi Sonu kılavuzu.

Bu makalede, Azure Stack Hub tümleşik sisteminde hangi grafik işleme birimi (GPU) modellerinin desteklendiği açıklanır. GPU'larla kullanılan sürücüleri yükleme yönergelerini de bulabilirsiniz. Azure Stack Hub'da GPU desteği yapay zeka, eğitim, çıkarım ve veri görselleştirme gibi çözümler sağlar. AMD Radeon Instinct MI25, Autodesk AutoCAD gibi yoğun grafik kullanan uygulamaları desteklemek için kullanılabilir.

Üç GPU modeli arasından seçim yapabilirsiniz. Bunlar NVIDIA V100, NVIDIA T4 ve AMD MI25 GPU'larında kullanılabilir. Bu fiziksel GPU'lar aşağıdaki Azure N Serisi sanal makine (VM) türleriyle aşağıdaki gibi hizalanır:

Uyarı

GPU VM'leri bu sürümde desteklenmez. Azure Stack Hub 2005 veya sonraki bir sürümüne yükseltmeniz gerekir. Buna ek olarak, Azure Stack Hub donanımınızın fiziksel GPU'ları olmalıdır.

NCv3

NCv3 serisi VM'ler NVIDIA Tesla V100 GPU'lar tarafından desteklenir. Müşteriler rezervuar modelleme, DNA sıralaması, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilir.

Boyut Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

NVv4 serisi sanal makineler, AMD Radeon Instinct MI25 GPU'ları tarafından desteklenir. NVv4 serisi Azure Stack Hub ile kısmi GPU'lara sahip sanal makineler tanıtılıyor. Bu boyut GPU hızlandırılmış grafik uygulamaları ve sanal masaüstleri için kullanılabilir. NVv4 sanal makineleri şu anda yalnızca Windows konuk işletim sistemini desteklemektedir.

Boyut Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NV4as_v4 4 14 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Boyut Sanal işlemci Bellek: GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

NC_A100 serisi VM'ler, Tesla V100 GPU'larının ardılı olan NVIDIA Ampere A100 GPU'lar tarafından desteklenir. Rezervuar modelleme, DNA sıralaması, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilirsiniz.

Boyut Sanal işlemci Bellek: GiB Geçici depolama (GiB) Maksimum veri diskleri GPU GPU bellek GiB En fazla NIC
Standard_NC24ads_A100_v4 24 220 1123 12 1 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

GPU sisteminde dikkat edilmesi gerekenler

  • GPU şu SKU'lardan biri olmalıdır: AMD MI-25, Nvidia V100 (ve çeşitleri), Nvidia T4.
  • Desteklenen sunucu başına GPU sayısı (1, 2, 3, 4). Tercih edilenler: 1, 2 ve 4.
  • Ölçek birimi boyunca tüm GPU'lar tam olarak aynı SKU'ya sahip olmalıdır.
  • Sunucu başına tüm GPU miktarları ölçek birimi boyunca aynı olmalıdır.
  • GPU bölüm boyutunun (AMD Mi25 için) ölçek birimindeki tüm GPU VM'lerinde aynı olması gerekir.

Kapasite planlaması

Azure Stack Hub kapasite planlayıcısı GPU yapılandırmalarını destekleyecek şekilde güncelleştirildi. üzerinde erişilebilir https://aka.ms/azstackcapacityplanner.

Mevcut azure stack hub'ına GPU ekleme

Azure Stack Hub artık mevcut herhangi bir sisteme GPU eklemeyi destekliyor. Bunu yapmak için stop-azurestack komutunu yürütür, stop-azurestack yordamını çalıştırır, GPU'lar ekler ve tamamlanıncaya kadar start-azurestack komutunu çalıştırır. Sistemde GPU'lar zaten varsa, daha önce oluşturulan GPU VM'lerinin durdurulması ve ardından yeniden başlatılması gerekir.

VM'lerin düzeltme eki ve güncelleştirme, FRU davranışı

GPU VM'leri, Azure Stack Hub'ın yama ve güncelleştirme (PnU) ve donanım değiştirme (FRU) gibi işlemler sırasında kapalı kalır. Aşağıdaki tabloda, bu etkinlikler sırasında gözlemlenen VM'nin durumu ve bu VM'leri işlemden sonra kullanılabilir hale getirmek için yapabileceğiniz el ile gerçekleştirilen eylem ele alınmaktadır.

İşlem PnU - Tam Güncelleştirme, OEM güncelleştirmesi FRU
VM durumu Güncelleştirme sırasında kullanılamaz. El ile çalışma ile kullanılabilir hale getirilebilir. VM, güncelleştirme sonrasında otomatik olarak çevrimiçidir. FRU sırasında kullanılamaz. El ile çalışma ile kullanılabilir hale getirilebilir. VM'nin FRU'ya geri getirilmesi gerekiyor
El ile işlem Vm'nin güncelleştirme sırasında kullanıma sunulması gerekiyorsa, kullanılabilir GPU bölümleri varsa, Vm portaldan Yeniden Başlat düğmesine tıklanarak yeniden başlatılabilir. VM, güncelleştirme sonrasında otomatik olarak geri gelecek VM, FRU sırasında kullanılamaz. Kullanılabilir GPU'lar varsa, VM FRU sırasında stop-deallocated ve yeniden başlatılabilir. FRU tamamlandıktan sonra, VM'nin Durdur düğmesi kullanılarak durdurularak serbest bırakılması ve Başlangıç düğmesi kullanılarak yedeklenmesi gerekir.

Konuk sürücü yüklemesi

Sürücü yüklemesi için aşağıdaki PowerShell cmdlet'leri kullanılabilir:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Azure Stack Hub GPU VM'nizin işletim sistemine, türüne ve bağlantısına bağlı olarak, aşağıdaki ayarlarla değiştirmeniz gerekir.

AMD MI25

Konuk sürücü sürümü, bağlantı durumundan bağımsız olarak Azure Stack Hub sürümüyle eşleşmelidir. Azure Stack Hub sürümüyle uyumlu olmayan daha yeni sürümlerin kullanılması kullanılabilirlik sorunlarına neden olabilir.

Azure Stack Hub Sürümü AMD Konuk sürücüsü
2206 21.Ç2-1, 20.Q4-1
2108 21.Ç2-1, 20.Q4-1
2102 21.Ç2-1, 20.Q4-1

Bağlı

Önceki bölümdeki PowerShell betiğini AMD için uygun sürücü türüyle kullanın. Windows çalıştıran N serisi VM'lere AMD GPU sürücüleri yükleme makalesi, NVv4 GPU-P özellikli VM'nin içinde AMD Radeon Instinct MI25 sürücüsünü yükleme yönergelerini ve sürücü yüklemesini doğrulama adımlarını sağlar.

Bağlantı kesildi

Uzantı sürücüyü internet üzerindeki bir konumdan çektiğinden, dış ağ bağlantısı kesilmiş bir VM'ye erişemez. Sürücüyü önceki tablodan indirebilir ve yerel ağınızdaki VM'nin erişebildiği bir depolama hesabına yükleyebilirsiniz.

AMD sürücüsünü bir depolama hesabına ekleyin ve içinde bu hesabın URL'sini Settingsbelirtin. Bu ayarlar Set-AzureRMVMExtension cmdlet'inde kullanılmalıdır. Örnek:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVİDİA

GPU kullanılarak CUDA veya GRID iş yükleri için sanal makineye NVIDIA sürücüleri yüklenmelidir.

Kullanım örneği: grafik/görselleştirme KıLAVUZU

Bu senaryo, GRID sürücülerinin kullanımını gerektirir. Gerekli lisanslara sahip olmanız koşuluyla GRID sürücüleri NVIDIA Application Hub üzerinden indirilebilir. GRID sürücüleri ayrıca, VM'de GRID sürücülerini kullanmadan önce uygun GRID lisanslarına sahip bir GRID lisans sunucusu gerektirir.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Kullanım örneği: işlem/CUDA - Bağlı

CUDA sürücülerinin lisans sunucusuna ve değiştirilmiş ayarlara ihtiyacı yoktur.

Kullanım örneği: işlem/CUDA - Bağlantısı kesildi

NVIDIA CUDA sürücülerine bağlantılar şu bağlantı kullanılarak edinilebilir: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

Ayarlarınız için bazı URL'lere başvurmanız gerekir.

URL Notlar
PUBKEY_URL PUBKEY_URL, Linux VM için değil Nvidia sürücü deposunun ortak anahtarıdır. Ubuntu sürücüsünü yüklemek için kullanılır.
DKMS_URL DKMS_URL, RedHat/CentOs üzerinde Nvidia çekirdek modülünü derlemek için paketi almak için kullanılır.
DRIVER_URL DRIVER_URL, Nvidia sürücüsünün depo bilgilerini indirmek için url'dir ve Linux VM'sinin depo listesine eklenir.
LIS_URL LIS_URL, RedHat/CentOs için Linux Tümleştirme Hizmeti paketini indirme URL'si, Hyper-V için Linux Integration Services v4.3 ve URL'de https://www.microsoft.com/download/details.aspx?id=55106 Azure varsayılan olarak yüklü değildir LIS_RHEL_ver Nvidia sürücüsüyle çalışması gereken geri dönüş çekirdek sürümüdür. Linux VM'sinin çekirdeği istenen Nvidia sürücüsüyle uyumlu değilse RedHat/CentOs üzerinde kullanılır.

URL'leri ayarlarınıza ekleyin.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Sonraki adımlar