Azure Stack Hub'da grafik işleme birimi (GPU) sanal makinesi (VM)
Dikkat
Bu makalede, Kullanım Süresi Sonu (EOL) durumuna yakın bir Linux dağıtımı olan CentOS'a başvuruda bulunur. Lütfen kullanımınızı göz önünde bulundurun ve buna göre planlayın. Daha fazla bilgi için bkz. CentOS Kullanım Süresi Sonu kılavuzu.
Bu makalede, Azure Stack Hub tümleşik sisteminde hangi grafik işleme birimi (GPU) modellerinin desteklendiği açıklanır. GPU'larla kullanılan sürücüleri yükleme yönergelerini de bulabilirsiniz. Azure Stack Hub'da GPU desteği yapay zeka, eğitim, çıkarım ve veri görselleştirme gibi çözümler sağlar. AMD Radeon Instinct MI25, Autodesk AutoCAD gibi yoğun grafik kullanan uygulamaları desteklemek için kullanılabilir.
Üç GPU modeli arasından seçim yapabilirsiniz. Bunlar NVIDIA V100, NVIDIA T4 ve AMD MI25 GPU'larında kullanılabilir. Bu fiziksel GPU'lar aşağıdaki Azure N Serisi sanal makine (VM) türleriyle aşağıdaki gibi hizalanır:
Uyarı
GPU VM'leri bu sürümde desteklenmez. Azure Stack Hub 2005 veya sonraki bir sürümüne yükseltmeniz gerekir. Buna ek olarak, Azure Stack Hub donanımınızın fiziksel GPU'ları olmalıdır.
NCv3
NCv3 serisi VM'ler NVIDIA Tesla V100 GPU'lar tarafından desteklenir. Müşteriler rezervuar modelleme, DNA sıralaması, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilir.
Boyut | Sanal işlemci | Bellek: GiB | Geçici depolama (SSD) GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NC6s_v3 | 6 | 112 | 736 | 1 | 16 | 12 | 4 |
Standard_NC12s_v3 | 12 | 224 | 1474 | 2 | 32 | 24 | 8 |
Standard_NC24s_v3 | 24 | 448 | 2948 | 4 | 64 | 32 | 8 |
NVv4
NVv4 serisi sanal makineler, AMD Radeon Instinct MI25 GPU'ları tarafından desteklenir. NVv4 serisi Azure Stack Hub ile kısmi GPU'lara sahip sanal makineler tanıtılıyor. Bu boyut GPU hızlandırılmış grafik uygulamaları ve sanal masaüstleri için kullanılabilir. NVv4 sanal makineleri şu anda yalnızca Windows konuk işletim sistemini desteklemektedir.
Boyut | Sanal işlemci | Bellek: GiB | Geçici depolama (SSD) GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NV4as_v4 | 4 | 14 | 88 | 1/8 | 2 | 4 | 2 |
Standard_NV8as_v4 | 8 | 28 | 176 | 1/4 | 4 | 8 | 4 |
Standard_NV16as_v4 | 16 | 56 | 352 | 1/2 | 8 | 16 | 8 |
Standard_NV32as_v4 | 32 | 112 | 704 | 1 | 16 | 32 | 8 |
NCasT4_v3
Boyut | Sanal işlemci | Bellek: GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|
Standard_NC4as_T4_v3 | 4 | 28 | 1 | 16 | 8 | 4 |
Standard_NC8as_T4_v3 | 8 | 56 | 1 | 16 | 16 | 8 |
Standard_NC16as_T4_v3 | 16 | 110 | 1 | 16 | 32 | 8 |
Standard_NC64as_T4_v3 | 64 | 440 | 4 | 64 | 32 | 8 |
NC_A100 v4
NC_A100 serisi VM'ler, Tesla V100 GPU'larının ardılı olan NVIDIA Ampere A100 GPU'lar tarafından desteklenir. Rezervuar modelleme, DNA sıralaması, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilirsiniz.
Boyut | Sanal işlemci | Bellek: GiB | Geçici depolama (GiB) | Maksimum veri diskleri | GPU | GPU bellek GiB | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | 1123 | 12 | 1 | 80 | 2 |
Standard_NC48ads_A100_v4 | 48 | 440 | 2246 | 24 | 2 | 160 | 4 |
GPU sisteminde dikkat edilmesi gerekenler
- GPU şu SKU'lardan biri olmalıdır: AMD MI-25, Nvidia V100 (ve çeşitleri), Nvidia T4.
- Desteklenen sunucu başına GPU sayısı (1, 2, 3, 4). Tercih edilenler: 1, 2 ve 4.
- Ölçek birimi boyunca tüm GPU'lar tam olarak aynı SKU'ya sahip olmalıdır.
- Sunucu başına tüm GPU miktarları ölçek birimi boyunca aynı olmalıdır.
- GPU bölüm boyutunun (AMD Mi25 için) ölçek birimindeki tüm GPU VM'lerinde aynı olması gerekir.
Kapasite planlaması
Azure Stack Hub kapasite planlayıcısı GPU yapılandırmalarını destekleyecek şekilde güncelleştirildi. üzerinde erişilebilir https://aka.ms/azstackcapacityplanner.
Mevcut azure stack hub'ına GPU ekleme
Azure Stack Hub artık mevcut herhangi bir sisteme GPU eklemeyi destekliyor. Bunu yapmak için stop-azurestack komutunu yürütür, stop-azurestack yordamını çalıştırır, GPU'lar ekler ve tamamlanıncaya kadar start-azurestack komutunu çalıştırır. Sistemde GPU'lar zaten varsa, daha önce oluşturulan GPU VM'lerinin durdurulması ve ardından yeniden başlatılması gerekir.
VM'lerin düzeltme eki ve güncelleştirme, FRU davranışı
GPU VM'leri, Azure Stack Hub'ın yama ve güncelleştirme (PnU) ve donanım değiştirme (FRU) gibi işlemler sırasında kapalı kalır. Aşağıdaki tabloda, bu etkinlikler sırasında gözlemlenen VM'nin durumu ve bu VM'leri işlemden sonra kullanılabilir hale getirmek için yapabileceğiniz el ile gerçekleştirilen eylem ele alınmaktadır.
İşlem | PnU - Tam Güncelleştirme, OEM güncelleştirmesi | FRU |
---|---|---|
VM durumu | Güncelleştirme sırasında kullanılamaz. El ile çalışma ile kullanılabilir hale getirilebilir. VM, güncelleştirme sonrasında otomatik olarak çevrimiçidir. | FRU sırasında kullanılamaz. El ile çalışma ile kullanılabilir hale getirilebilir. VM'nin FRU'ya geri getirilmesi gerekiyor |
El ile işlem | Vm'nin güncelleştirme sırasında kullanıma sunulması gerekiyorsa, kullanılabilir GPU bölümleri varsa, Vm portaldan Yeniden Başlat düğmesine tıklanarak yeniden başlatılabilir. VM, güncelleştirme sonrasında otomatik olarak geri gelecek | VM, FRU sırasında kullanılamaz. Kullanılabilir GPU'lar varsa, VM FRU sırasında stop-deallocated ve yeniden başlatılabilir. FRU tamamlandıktan sonra, VM'nin Durdur düğmesi kullanılarak durdurularak serbest bırakılması ve Başlangıç düğmesi kullanılarak yedeklenmesi gerekir. |
Konuk sürücü yüklemesi
Sürücü yüklemesi için aşağıdaki PowerShell cmdlet'leri kullanılabilir:
$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"
Set-AzureRmVMExtension -Location $Location `
-Publisher $driverPublisher `
-ExtensionType $driverType `
-TypeHandlerVersion $driverVersion `
-VMName $VmName `
-ResourceGroupName $ResourceGroupName `
-Name $driverName `
-Settings $Settings ` # If no settings are set, omit this parameter
-Verbose
Azure Stack Hub GPU VM'nizin işletim sistemine, türüne ve bağlantısına bağlı olarak, aşağıdaki ayarlarla değiştirmeniz gerekir.
AMD MI25
Konuk sürücü sürümü, bağlantı durumundan bağımsız olarak Azure Stack Hub sürümüyle eşleşmelidir. Azure Stack Hub sürümüyle uyumlu olmayan daha yeni sürümlerin kullanılması kullanılabilirlik sorunlarına neden olabilir.
Azure Stack Hub Sürümü | AMD Konuk sürücüsü |
---|---|
2206 | 21.Ç2-1, 20.Q4-1 |
2108 | 21.Ç2-1, 20.Q4-1 |
2102 | 21.Ç2-1, 20.Q4-1 |
Bağlı
Önceki bölümdeki PowerShell betiğini AMD için uygun sürücü türüyle kullanın. Windows çalıştıran N serisi VM'lere AMD GPU sürücüleri yükleme makalesi, NVv4 GPU-P özellikli VM'nin içinde AMD Radeon Instinct MI25 sürücüsünü yükleme yönergelerini ve sürücü yüklemesini doğrulama adımlarını sağlar.
Bağlantı kesildi
Uzantı sürücüyü internet üzerindeki bir konumdan çektiğinden, dış ağ bağlantısı kesilmiş bir VM'ye erişemez. Sürücüyü önceki tablodan indirebilir ve yerel ağınızdaki VM'nin erişebildiği bir depolama hesabına yükleyebilirsiniz.
AMD sürücüsünü bir depolama hesabına ekleyin ve içinde bu hesabın URL'sini Settings
belirtin. Bu ayarlar Set-AzureRMVMExtension cmdlet'inde kullanılmalıdır. Örnek:
$Settings = @{
"DriverURL" = <URL to driver in storage account>
}
NVİDİA
GPU kullanılarak CUDA veya GRID iş yükleri için sanal makineye NVIDIA sürücüleri yüklenmelidir.
Kullanım örneği: grafik/görselleştirme KıLAVUZU
Bu senaryo, GRID sürücülerinin kullanımını gerektirir. Gerekli lisanslara sahip olmanız koşuluyla GRID sürücüleri NVIDIA Application Hub üzerinden indirilebilir. GRID sürücüleri ayrıca, VM'de GRID sürücülerini kullanmadan önce uygun GRID lisanslarına sahip bir GRID lisans sunucusu gerektirir.
$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="GRID"
}
Kullanım örneği: işlem/CUDA - Bağlı
CUDA sürücülerinin lisans sunucusuna ve değiştirilmiş ayarlara ihtiyacı yoktur.
Kullanım örneği: işlem/CUDA - Bağlantısı kesildi
NVIDIA CUDA sürücülerine bağlantılar şu bağlantı kullanılarak edinilebilir: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json
Windows:
$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="CUDA"
}
Linux:
Ayarlarınız için bazı URL'lere başvurmanız gerekir.
URL | Notlar |
---|---|
PUBKEY_URL | PUBKEY_URL, Linux VM için değil Nvidia sürücü deposunun ortak anahtarıdır. Ubuntu sürücüsünü yüklemek için kullanılır. |
DKMS_URL | DKMS_URL, RedHat/CentOs üzerinde Nvidia çekirdek modülünü derlemek için paketi almak için kullanılır. |
DRIVER_URL | DRIVER_URL, Nvidia sürücüsünün depo bilgilerini indirmek için url'dir ve Linux VM'sinin depo listesine eklenir. |
LIS_URL | LIS_URL, RedHat/CentOs için Linux Tümleştirme Hizmeti paketini indirme URL'si, Hyper-V için Linux Integration Services v4.3 ve URL'de https://www.microsoft.com/download/details.aspx?id=55106 Azure varsayılan olarak yüklü değildir LIS_RHEL_ver Nvidia sürücüsüyle çalışması gereken geri dönüş çekirdek sürümüdür. Linux VM'sinin çekirdeği istenen Nvidia sürücüsüyle uyumlu değilse RedHat/CentOs üzerinde kullanılır. |
URL'leri ayarlarınıza ekleyin.
$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin