Máquinas virtuales de GPU para dispositivos de GPU de Azure Stack Edge Pro

SE APLICA A:Yes for Pro - GPU SKUAzure Stack Edge Pro: GPUYes for Pro 2 SKUAzure Stack Edge Pro 2Yes for Pro R SKUAzure Stack Edge Pro R

Las cargas de trabajo con aceleración de GPU en un dispositivo de GPU de Azure Stack Edge Pro requieren una máquina virtual de GPU. En este artículo se proporciona información general sobre las máquinas virtuales de GPU, incluidos los sistemas operativos compatibles, los controladores de GPU y los tamaños de máquina virtual. También se analizan las opciones de implementación de las máquinas virtuales de GPU que se usan con clústeres de Kubernetes.

Acerca de las máquinas virtuales con GPU

Los dispositivos Azure Stack Edge están equipados con 1 o 2 GPU Tesla T4 o Tensor Core A2 de NVIDIA. Para implementar cargas de trabajo de máquinas virtuales con aceleración de GPU en estos dispositivos, use tamaños de máquina virtual optimizados para GPU. La máquina virtual de GPU elegida debe coincidir con la marca de la GPU en el dispositivo Azure Stack Edge. Para más información, consulte Máquinas virtuales optimizadas para GPU compatibles de la serie N.

Para aprovechar las funcionalidades de GPU de las máquinas virtuales de la serie N de Azure, se deben instalar los controladores de GPU de Nvidia. La extensión del controlador de GPU de Nvidia instala los controladores CUDA o GRID de Nvidia adecuados. Puede instalar las extensiones de GPU mediante plantillas o a través de Azure Portal.

Puede instalar y administrar la extensión mediante las plantillas de Azure Resource Manager después de implementar una máquina virtual. En Azure Portal, puede instalar la extensión de GPU mientras implementa una máquina virtual o después de hacerlo. Para obtener instrucciones, consulte Implementación de máquinas virtuales de GPU en el dispositivo de Azure Stack Edge.

Si el dispositivo tendrá configurado un clúster de Kubernetes, asegúrese de revisar las consideraciones de implementación de los clústeres de Kubernetes antes de implementar máquinas virtuales de GPU.

Sistema operativo y controladores de GPU admitidos

Las extensiones de controlador de GPU de Nvidia para Windows y Linux admiten las siguientes versiones del sistema operativo.

Sistema operativo admitido para la extensión de GPU para Windows

Esta extensión admite los siguientes sistemas operativos. Otras versiones pueden funcionar, pero no se han probado internamente en máquinas virtuales con GPU que se ejecutan en dispositivos Azure Stack Edge.

Distribución Versión
Windows Server 2019 Core
Windows Server 2016 Core

Sistema operativo admitido para la extensión de GPU para Linux

Esta extensión admite las siguientes distribuciones del sistema operativo, en función de la compatibilidad del controlador para la versión específica del sistema operativo. Otras versiones pueden funcionar, pero no se han probado internamente en máquinas virtuales con GPU que se ejecutan en dispositivos Azure Stack Edge.

Distribución Versión
Ubuntu 18.04 LTS
Red Hat Enterprise Linux 7.4

Implementación de máquina virtual de GPU

Puede implementar una máquina virtual de GPU a través de Azure Portal o mediante plantillas de Azure Resource Manager. La extensión de GPU se instala después de la creación de la máquina virtual.

Máquinas virtuales con GPU y Kubernetes

Antes de implementar máquinas virtuales con GPU en el dispositivo y, si Kubernetes está configurado en el dispositivo, revise las siguientes consideraciones.

Para un dispositivo con 1 GPU:

  • Cree una máquina virtual de GPU seguida de la configuración de Kubernetes en el dispositivo: en este escenario, la creación de máquinas virtuales de GPU y la configuración de Kubernetes se realizarán correctamente. En este caso, Kubernetes no tendrá acceso a la GPU.

  • Configuración de Kubernetes en el dispositivo seguido de la creación de una máquina virtual de GPU: en este escenario, Kubernetes reclamará la GPU en el dispositivo y se producirá un error en la creación de la máquina virtual, ya que no hay recursos de GPU disponibles.

Para un dispositivo con 2 GPU:

  • Cree una máquina virtual de GPU seguida de la configuración de Kubernetes en el dispositivo: en este escenario, la máquina virtual de GPU que cree reclamará una GPU en el dispositivo y la configuración de Kubernetes también se realizarán correctamente y reclamarán el resto de una GPU.

  • Cree dos máquinas virtuales de GPU seguidas de la configuración de Kubernetes en el dispositivo: en este escenario, las dos máquinas virtuales de GPU reclamarán las dos GPU en el dispositivo y Kubernetes se configura correctamente sin GPU.

  • Configuración de Kubernetes en el dispositivo seguido de la creación de una máquina virtual de GPU: en este escenario, Kubernetes reclamará las GPU en el dispositivo y la creación de la máquina virtual producirá un error, ya que no hay recursos de GPU disponibles.

Pasos siguientes