Instalación de controladores de GPU de NVIDIA en VM de la serie N con WindowsInstall NVIDIA GPU drivers on N-series VMs running Windows

Para aprovechar las funcionalidades de GPU de las máquinas virtuales de la serie N de Azure que ejecutan Windows, deben instalarse controladores de GPU de NVIDIA.To take advantage of the GPU capabilities of Azure N-series VMs running Windows, NVIDIA GPU drivers must be installed. La extensión de controlador de GPU de NVIDIA instala los controladores CUDA de NVIDIA o GRID adecuados en una máquina virtual de la serie N.The NVIDIA GPU Driver Extension installs appropriate NVIDIA CUDA or GRID drivers on an N-series VM. Instale o administre la extensión mediante Azure Portal o con herramientas como las plantillas de Azure PowerShell o Azure Resource Manager.Install or manage the extension using the Azure portal or tools such as Azure PowerShell or Azure Resource Manager templates. Consulte la documentación de la extensión de controlador de GPU de NVIDIA para los sistemas operativos compatibles y los pasos de implementación.See the NVIDIA GPU Driver Extension documentation for supported operating systems and deployment steps.

Si decide instalar manualmente los controladores de GPU, este artículo proporciona pasos de instalación y verificación, controladores y los sistemas operativos compatibles.If you choose to install GPU drivers manually, this article provides supported operating systems, drivers, and installation and verification steps. También está disponible la información de instalación manual del controlador para las máquinas virtuales Linux.Manual driver setup information is also available for Linux VMs.

Para conocer las especificaciones básicas, las capacidades de almacenamiento y los detalles del disco, consulte Tamaño de máquinas virtuales para GPU Windows.For basic specs, storage capacities, and disk details, see GPU Windows VM sizes.

Sistemas operativos y controladores compatiblesSupported operating systems and drivers

Controladores NVIDIA Tesla (CUDA)NVIDIA Tesla (CUDA) drivers

Los controladores NVIDIA Tesla (CUDA) para máquinas virtuales de las series NC, NCv2, NCv3, ND y NDv2 (y opcionales para la serie NV) solo se admiten en las distribuciones de sistemas operativos enumeradas en la tabla siguiente.NVIDIA Tesla (CUDA) drivers for NC, NCv2, NCv3, ND, and NDv2-series VMs (optional for NV-series) are supported only on the operating systems listed in the following table. Los vínculos de descarga de controladores están actualizados en el momento de la publicación.Driver download links are current at time of publication. Para ver los controladores más recientes, visite el sitio web de NVIDIA.For the latest drivers, visit the NVIDIA website.

Sugerencia

Como alternativa a la instalación manual de controladores de CUDA en una máquina virtual de Windows Server, puede implementar una imagen de Data Science Virtual Machine de Azure.As an alternative to manual CUDA driver installation on a Windows Server VM, you can deploy an Azure Data Science Virtual Machine image. Las ediciones de DSVM para Windows Server 2016 preinstalan los controladores NVIDIA CUDA, la biblioteca CUDA Deep Neural Network Library y otras herramientas.The DSVM editions for Windows Server 2016 pre-install NVIDIA CUDA drivers, the CUDA Deep Neural Network Library, and other tools.

SOOS ControladorDriver
Windows Server 2016Windows Server 2016 398.75 (.exe)398.75 (.exe)
Windows Server 2012 R2Windows Server 2012 R2 398.75 (.exe)398.75 (.exe)

Controladores de NVIDIA GRIDNVIDIA GRID drivers

Microsoft redistribuye los instaladores del controlador NVIDIA GRID para VM de las series NV y NVv2 que se emplean como estaciones de trabajo virtuales o para aplicaciones virtuales.Microsoft redistributes NVIDIA GRID driver installers for NV and NVv2-series VMs used as virtual workstations or for virtual applications. Instale estos controladores GRID en máquinas virtuales de la serie NV de Azure y solo en los sistemas operativos enumerados en la tabla siguiente.Install only these GRID drivers on Azure NV VMs, only on the operating systems listed in the following table. Estos controladores incluyen licencias del software GRID Virtual GPU en Azure.These drivers include licensing for GRID Virtual GPU Software in Azure. No es necesario configurar un servidor de licencias de software vGPU NVIDIA.You do not need to set up an NVIDIA vGPU software license server.

SOOS ControladorDriver
Windows Server 2016Windows Server 2016

Windows 10 (hasta la versión 1803)Windows 10 (up to version 1803)
GRID 7 (411.81) (.exe)GRID 7 (411.81) (.exe)
Windows Server 2012 R2Windows Server 2012 R2 GRID 7 (411.81) (.exe)GRID 7 (411.81) (.exe)

Instalación del controladorDriver installation

  1. Conéctese mediante Escritorio remoto a cada máquina virtual de la serie N.Connect by Remote Desktop to each N-series VM.

  2. Descargue, extraiga e instale el controlador compatible con su sistema operativo Windows.Download, extract, and install the supported driver for your Windows operating system.

Después de la instalación de controladores de GRID en una VM, se requiere un reinicio.After GRID driver installation on a VM, a restart is required. Después de la instalación de controladores de CUDA, no se requiere un reinicio.After CUDA driver installation, a restart is not required.

Comprobación de la instalación del controladorVerify driver installation

Puede comprobar la instalación del controlador en el Administrador de dispositivos.You can verify driver installation in Device Manager. En el ejemplo siguiente se muestra una configuración correcta de la tarjeta Tesla K80 en una máquina virtual de Azure NC.The following example shows successful configuration of the Tesla K80 card on an Azure NC VM.

Propiedades del controlador de GPU

Para consultar el estado del dispositivo de GPU, ejecute la utilidad de línea de comandos smi nvidia que se instala con el controlador.To query the GPU device state, run the nvidia-smi command-line utility installed with the driver.

  1. Abra un símbolo del sistema y cambie al directorio C:\Program Files\NVIDIA Corporation\NVSMI.Open a command prompt and change to the C:\Program Files\NVIDIA Corporation\NVSMI directory.

  2. Ejecute nvidia-smi.Run nvidia-smi. Si el controlador está instalado, verá una salida parecida a la siguiente.If the driver is installed, you will see output similar to the following. La utilidad GPU-Util muestra 0 %, salvo que se esté ejecutando una carga de trabajo de GPU en la máquina virtual.The GPU-Util shows 0% unless you are currently running a GPU workload on the VM. La versión del controlador y los detalles de GPU pueden ser diferentes de los que se muestran.Your driver version and GPU details may be different from the ones shown.

Estado del dispositivo de NVIDIA

Conectividad de red RDMARDMA network connectivity

La conectividad de red RDMA puede habilitarse en las máquinas virtuales de la serie N que puedan usar RDMA, como la NC24r, implementadas en el mismo conjunto de disponibilidad o en un único grupo de selección de red en un conjunto de escalado de máquinas virtuales.RDMA network connectivity can be enabled on RDMA-capable N-series VMs such as NC24r deployed in the same availability set or in a single placement group in a virtual machine scale set. En las máquinas virtuales compatibles con RDMA, es necesario agregar la extensión HpcVmDrivers a las máquinas virtuales para instalar los controladores de dispositivos de red de Windows necesarios para la conectividad RDMA.The HpcVmDrivers extension must be added to install Windows network device drivers that enable RDMA connectivity. Para agregar la extensión de máquina virtual a una máquina virtual de la serie N habilitada para RDMA, puede usar cmdlets de Azure PowerShell para Azure Resource Manager.To add the VM extension to an RDMA-enabled N-series VM, use Azure PowerShell cmdlets for Azure Resource Manager.

Para instalar la versión más reciente de la extensión HpcVMDrivers 1.1 en una máquina virtual compatible con RDMA existente denominada "myVM" en la región de oeste de EE. UU.:To install the latest version 1.1 HpcVMDrivers extension on an existing RDMA-capable VM named myVM in the West US region:

Set-AzureRmVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "HpcVmDrivers" -Publisher "Microsoft.HpcCompute" -Type "HpcVmDrivers" -TypeHandlerVersion "1.1"

Para obtener más información, consulte Características y extensiones de las máquinas virtuales para Windows.For more information, see Virtual machine extensions and features for Windows.

Ahora, la red RDMA admite el tráfico de interfaz de paso de mensajes (MPI) para aplicaciones que se ejecutan con Microsoft MPI o Intel MPI 5.x.The RDMA network supports Message Passing Interface (MPI) traffic for applications running with Microsoft MPI or Intel MPI 5.x.

Pasos siguientesNext steps

  • Los desarrolladores que creen aplicaciones con aceleración por GPU para las GPU Tesla de NVIDIA también pueden descargar e instalar el último CUDA Toolkit.Developers building GPU-accelerated applications for the NVIDIA Tesla GPUs can also download and install the latest CUDA Toolkit. Para obtener más información, consulte la guía de instalación de CUDA.For more information, see the CUDA Installation Guide.