Installera GPU-tillägg på virtuella datorer för din Azure Stack Edge Pro GPU-enhet

GÄLLER FÖR:Yes for Pro GPU SKU Azure Stack Edge Pro – GPU Yes for Pro R SKU Azure Stack Edge Pro R

Den här artikeln beskriver hur du installerar GPU-drivrutinstillägget för att installera lämpliga Nvidia-drivrutiner på de virtuella GPU-datorer som körs Azure Stack Edge enheten. Artikeln beskriver installationsstegen för att installera ett GPU-tillägg med hjälp Azure Resource Manager mallar på både Windows och virtuella Linux-datorer.

Anteckning

I Azure Portal kan du installera ett GPU-tillägg när du skapar den virtuella datorn eller när den virtuella datorn har distribuerats. Anvisningar och krav finns i Distribuera virtuella GPU-datorer.

Förutsättningar

Kontrollera följande innan du installerar GPU-tillägget på de virtuella GPU-datorer som körs på enheten:

  1. Du har åtkomst till en Azure Stack Edge enhet där du har distribuerat en eller flera virtuella GPU-datorer. Se hur du distribuerar en virtuell GPU-dator på din enhet.

    • Kontrollera att porten som är aktiverad för beräkningsnätverket på enheten är ansluten till Internet och har åtkomst. GPU-drivrutinerna laddas ned via Internetåtkomst.

      Här är ett exempel där port 2 var ansluten till Internet och användes för att aktivera beräkningsnätverket. Om Kubernetes inte har distribuerats i din miljö kan du hoppa över Kubernetes-nodens IP-adress och IP-tilldelning för externa tjänster.

      Screenshot of the Compute pane for an Azure Stack Edge device. Compute settings for Port 2 are highlighted.

  2. Ladda ned GPU-tilläggsmallarna och parameterfilerna till klientdatorn. Packa upp den till en katalog som du använder som arbetskatalog.

  3. Kontrollera att klienten som du använder för att komma åt enheten fortfarande är ansluten till Azure Resource Manager över Azure PowerShell. Anslutningen till Azure Resource Manager upphör att gälla var 1,5 timme eller om Azure Stack Edge startas om. Om detta inträffar returnerar alla cmdlets som du kör felmeddelanden om att du inte längre är ansluten till Azure. Du måste logga in igen. Detaljerade anvisningar finns i Anslut för Azure Resource Manager på din Azure Stack Edge enhet.

Redigera parameterfilen

Beroende på operativsystemet för den virtuella datorn kan du installera GPU-tillägget för Windows eller för Linux.

Om du vill distribuera Nvidia GPU-drivrutiner för en befintlig virtuell dator redigerar du addGPUExtWindowsVM.parameters.json parameterfilen och distribuerar sedan mallen addGPUextensiontoVM.json .

Filen addGPUExtWindowsVM.parameters.json tar följande parametrar:

"parameters": {	
	"vmName": {
	"value": "<name of the VM>" 
	},
	"extensionName": {
	"value": "<name for the extension. Example: windowsGpu>" 
	},
	"publisher": {
	"value": "Microsoft.HpcCompute" 
	},
	"type": {
	"value": "NvidiaGpuDriverWindows" 
	},
	"typeHandlerVersion": {
	"value": "1.3" 
	},
	"settings": {
	"value": {
	"DriverURL" : "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
	"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
	"DriverType":"CUDA"
	}
	}
	}

Distribuera mallen

Distribuera mallen addGPUextensiontoVM.json . Den här mallen distribuerar tillägget till en befintlig virtuell dator. Kör följande kommando:

$templateFile = "<Path to addGPUextensiontoVM.json>" 
$templateParameterFile = "<Path to addGPUExtWindowsVM.parameters.json>" 
$RGName = "<Name of your resource group>"
New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "<Name for your deployment>"

Anteckning

Tilläggsdistributionen är ett långvarigt jobb som tar cirka 10 minuter att slutföra.

Här är exempel på utdata:

PS C:\WINDOWS\system32> "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json
PS C:\WINDOWS\system32> $templateFile = "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
PS C:\WINDOWS\system32> $templateParameterFile = "C:\12-09-2020\ExtensionTemplates\addGPUExtWindowsVM.parameters.json"
PS C:\WINDOWS\system32> $RGName = "myasegpuvm1"
PS C:\WINDOWS\system32> New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "deployment3"

DeploymentName          : deployment3
ResourceGroupName       : myasegpuvm1
ProvisioningState       : Succeeded
Timestamp               : 12/16/2020 12:18:50 AM
Mode                    : Incremental
TemplateLink            :
Parameters              :
                          Name             Type                       Value
                          ===============  =========================  ==========
                          vmName           String                     VM2
                          extensionName    String                     windowsgpuext
                          publisher        String                     Microsoft.HpcCompute
                          type             String                     NvidiaGpuDriverWindows
                          typeHandlerVersion  String                     1.3
                          settings         Object                     {
                            "DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
                            "DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
                            "DriverType": "CUDA"
                          }

Outputs                 :
DeploymentDebugLogLevel :
PS C:\WINDOWS\system32>

Spåra distribution

Kör följande kommando för att kontrollera distributionstillståndet för tillägg för en viss virtuell dator:

Get-AzureRmVMExtension -ResourceGroupName <Name of resource group> -VMName <Name of VM> -Name <Name of the extension>

Här är exempel på utdata:

PS C:\WINDOWS\system32> Get-AzureRmVMExtension -ResourceGroupName myasegpuvm1 -VMName VM2 -Name windowsgpuext

ResourceGroupName       : myasegpuvm1
VMName                  : VM2
Name                    : windowsgpuext
Location                : dbelocal
Etag                    : null
Publisher               : Microsoft.HpcCompute
ExtensionType           : NvidiaGpuDriverWindows
TypeHandlerVersion      : 1.3
Id                      : /subscriptions/947b3cfd-7a1b-4a90-7cc5-e52caf221332/resourceGroups/myasegpuvm1/providers/Microsoft.Compute/virtualMachines/VM2/extensions/windowsgpuext
PublicSettings          : {
                            "DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
                            "DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
                            "DriverType": "CUDA"
                          }
ProtectedSettings       :
ProvisioningState       : Creating
Statuses                :
SubStatuses             :
AutoUpgradeMinorVersion : True
ForceUpdateTag          :

PS C:\WINDOWS\system32>

Utdata för körning av tillägg loggas i följande fil. Referera till den här C:\Packages\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\1.3.0.0\Status filen för att spåra status för installationen.

En lyckad installation anges av en message som Enable Extension och som statussuccess .

"status":  {
                       "formattedMessage":  {
                                                "message":  "Enable Extension",
                                                "lang":  "en"
                                            },
                       "name":  "NvidiaGpuDriverWindows",
                       "status":  "success",

Verifiera drivrutinsinstallationen

Logga in på den virtuella datorn och kör kommandoradsverktyget nvidia-smi installerat med drivrutinen. nvidia-smi.exefinns på C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe . Om du inte ser filen är det möjligt att drivrutinsinstallationen fortfarande körs i bakgrunden. Vänta i 10 minuter och kontrollera igen.

Om drivrutinen är installerad visas utdata som liknar följande exempel:

PS C:\Users\Administrator> cd "C:\Program Files\NVIDIA Corporation\NVSMI"
PS C:\Program Files\NVIDIA Corporation\NVSMI> ls

    Directory: C:\Program Files\NVIDIA Corporation\NVSMI

Mode                LastWriteTime         Length Name
----                -------------         ------ ----
-a----        2/26/2020  12:00 PM         849640 MCU.exe
-a----        2/26/2020  12:00 PM         443104 nvdebugdump.exe
-a----        2/25/2020   2:06 AM          81823 nvidia-smi.1.pdf
-a----        2/26/2020  12:01 PM         566880 nvidia-smi.exe
-a----        2/26/2020  12:01 PM         991344 nvml.dll

PS C:\Program Files\NVIDIA Corporation\NVSMI> .\nvidia-smi.exe
Wed Dec 16 00:35:51 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 442.50       Driver Version: 442.50       CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla T4            TCC  | 0000503C:00:00.0 Off |                    0 |
| N/A   35C    P8    11W /  70W |      8MiB / 15205MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
PS C:\Program Files\NVIDIA Corporation\NVSMI>

Mer information finns i Nvidia GPU-drivrutinstillägg för Windows.

Anteckning

När du har installerat GPU-drivrutinen och GPU-tillägget behöver du inte längre använda en port med Internetåtkomst för beräkning.

Ta bort GPU-tillägg

Om du vill ta bort GPU-tillägget använder du följande kommando:

Remove-AzureRmVMExtension -ResourceGroupName <Resource group name> -VMName <VM name> -Name <Extension name>

Här är exempel på utdata:

PS C:\azure-stack-edge-deploy-vms> Remove-AzureRmVMExtension -ResourceGroupName rgl -VMName WindowsVM -Name windowsgpuext
Virtual machine extension removal operation
This cmdlet will remove the specified virtual machine extension. Do you want to continue? [Y] Yes [N] No [S] Suspend [?] Help (default is "Y"): y
Requestld IsSuccessStatusCode StatusCode ReasonPhrase
--------- ------------------- ---------- ------------    
          True                OK         OK

Nästa steg

Lär dig att: