řešení potíží s rozšířením gpu pro virtuální počítače gpu na Azure Stack Edge Pro GPU

platí pro:  Ano pro procesory GPU pro SKU Azure Stack Edge pro-GPU  Ano pro R SKU Azure Stack Edge pro r                             

tento článek obsahuje pokyny pro řešení nejběžnějších problémů, které způsobují instalaci rozšíření gpu na virtuálním počítači gpu, aby selhaly na Azure Stack hraničních zařízeních Pro GPU.

Pokyny k instalaci najdete v tématu Instalace rozšíření GPU.

Velikost virtuálního počítače není velikost virtuálního počítače GPU

Popis chyby: Virtuální počítač GPU musí být buď Standard_NC4as_T4_v3, nebo Standard_NC8as_T4_v3 velikost. Pokud použijete jinou velikost virtuálního počítače, rozšíření GPU se nepodaří připojit.

Navrhované řešení: Vytvořte virtuální počítač s velikostí virtuálního počítače Standard_NC4as_T4_v3 nebo Standard_NC8as_T4_v3. Další informace najdete v tématu podporované velikosti virtuálních počítačů pro virtuální počítače GPU. Informace o určení velikosti najdete v tématu Vytvoření virtuálních počítačů GPU.

Image OS není podporovaná.

Popis chyby: Rozšíření GPU nepodporuje operační systém, který je nainstalovaný na imagi virtuálního počítače.

Navrhované řešení: Připravte novou image virtuálního počítače s operačním systémem, který podporuje rozšíření GPU.

Parametr rozšíření je nesprávný.

Popis chyby: Při nasazení rozšíření GPU na virtuálním počítači se systémem Linux byla použita nesprávná nastavení rozšíření.

Navrhované řešení: Před nasazením rozšíření GPU upravte soubor parametrů. Další informace najdete v tématu Instalace rozšíření GPU.

Nepovedlo se nainstalovat rozšíření virtuálního počítače při stahování balíčku.

Popis chyby: Při instalaci rozšíření nebo ve stavu povolení došlo k chybě zřizování rozšíření.

  1. V protokolu hosta vyhledejte přidruženou chybu. Pokud chcete shromáždit protokoly hostů, přečtěte si téma shromáždění protokolů hostů pro virtuální počítače na Azure Stack Edge pro.

    Na virtuálním počítači se systémem Linux:

    • Prohlédněte si /var/log/waagent.log nebo /var/log/azure/nvidia-vmext-status .

    na Windowsm virtuálním počítači:

    • Zjistěte stav chyby v C:\Packages\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\1.3.0.0\Status .
    • Projděte si kompletní protokol spuštění: C:\WindowsAzure\Logs\WaAppAgent.txt .

    Pokud během stahování balíčku došlo k chybě, tato chyba indikuje, že virtuální počítač nemohl získat přístup k veřejné síti, aby mohl stáhnout ovladač.

Navrhované řešení:

  1. Povolte výpočetní prostředky na portu, který je připojený k Internetu. Pokyny najdete v tématu Vytvoření virtuálních počítačů GPU.

  2. Uvolněte virtuální počítač zastavením virtuálního počítače na portálu. Pokud chcete virtuální počítač zastavit, otevřete Přehled virtuálních počítačů > a vyberte virtuální počítač. Pak na stránce vlastností virtuálního počítače vyberte zastavit.

  3. Vytvořte nový virtuální počítač.

Rozšíření virtuálního počítače selhalo s chybou dpkg is used/yum lock is used (virtuální počítač se systémem Linux).

Popis chyby: Nasazení rozšíření GPU na virtuálním počítači se systémem Linux se nezdařilo, protože byl použit jiný proces dpkg nebo byl vytvořen jiný proces yum lock .

Navrhované řešení: Chcete-li vyřešit tento problém, proveďte tyto kroky:

  1. Pokud chcete zjistit, jaký proces se aplikuje na zámek, vyhledejte chybu v protokolu \var\log\azure\nvidia-vmext-status, jako je například "bázi dpkg používá jiný proces" nebo "jiná aplikace je držená yum lock ".

  2. Buď počkejte na dokončení procesu, nebo proces ukončete.

  3. Nainstalujte znovu rozšíření GPU .

  4. Pokud se nasazení rozšíření znovu nepovede, vytvořte nový virtuální počítač a ujistěte se, že zámek není k dispozici, než nainstalujete rozšíření GPU.

Další kroky

Shromažďování protokolů hostů a vytvoření balíčku pro podporu