Установка драйверов GPU NVIDIA на виртуальные машины серии N под управлением Windows

Применимо к: ✔️ Виртуальные машины Linux ✔️ Виртуальные машины Windows ✔️ Гибкие масштабируемые наборы

Чтобы воспользоваться всеми преимуществами GPU виртуальных машин Azure серии N, необходимо установить драйверы GPU NVIDIA. Расширение драйвера GPU NVIDIA устанавливает необходимые драйверы CUDA или GRID NVIDIA на виртуальную машину серии N. Для установки расширения и управления им можно использовать портал Azure или такие инструменты, как Azure PowerShell и шаблоны Azure Resource Manager. Сведения о поддерживаемых операционных системах и этапах развертывания см. в документации по расширению драйвера GPU NVIDIA.

Если вы решили установить драйверы GPU NVIDIA вручную, воспользуйтесь представленными здесь сведениями о поддерживаемых операционных системах, ссылками на драйверы и инструкциями по установке и проверке. Сведения о ручной установке драйверов также доступны для виртуальных машин Linux.

Основные характеристики, сведения о дисках и объеме памяти см. в статье Графический процессор.

Поддерживаемые операционные системы и драйверы

Драйверы NVIDIA Tesla (CUDA)

Драйверы NVIDIA Tesla (CUDA) для виртуальных машин серий NC, NCv2, NCv3, NCasT4_v3, ND и NDv2 (необязательно для серии NV) тестируются в операционных системах, перечисленных в следующей таблице. Драйвер CUDA является универсальным и не зависит от Azure. Последние версии драйверов можно получить на веб-сайте NVIDIA.

Совет

Вместо ручной установки драйвера CUDA на виртуальной машине Windows Server можно развернуть образ виртуальной машины для обработки и анализа данных Azure. Выпуски DSVM Windows Server 2016 предварительно устанавливают драйверы NVIDIA CUDA, библиотеку глубокой нейронной сети CUDA и другие средства.

OS Драйвер
Windows Server 2019 451.82 (EXE-файл)
Windows Server 2016 451.82 (EXE-файл)

Драйверы NVIDIA GRID

Корпорация Майкрософт распространяет установщики драйверов NVIDIA GRID для виртуальных машин серии NV и NVv3, используемых в качестве виртуальных рабочих станций или виртуальных приложений. Эти драйверы GRID следует устанавливать только на виртуальные машины Azure серии NV под управлением операционных систем, перечисленных в следующей таблице. Эти драйверы содержат лицензии на ПО виртуального графического процессора GRID в Azure. Вам не нужно настраивать сервер лицензий программного обеспечения vGPU NVIDIA.

Драйверы сетки, распространяемые Azure, не работают на виртуальных машинах серии, отличных от NV, таких как NCv2, NCv3, ND и NDv2-series. Единственным исключением является серия виртуальных машин NCas_T4_V3, в которой драйверы GRID будут включать графические функции, аналогичные возможностям серии NV.

NC-Series с графическими процессорами NVIDIA K80 не поддерживают графические приложения и приложения GRID.

Расширение NVIDIA всегда устанавливает последнюю версию драйвера. Следующие ссылки на предыдущие версии предоставляются для поддержки зависимостей от старых версий драйверов.

Для Windows Server 2022, Windows Server 2019, Windows Server 2016 1607, 1709, Windows 10 и Windows 11:

Для Windows Server 2012 R2:

Примечание

Виртуальные машины Azure NVads A10 версии 5 поддерживают только GRID 14.1(512.78) или более поздние версии драйверов.

Ссылки на все предыдущие версии драйвера Nvidia GRID см. GitHub.

Установка драйвера

  1. Подключитесь к каждой виртуальной машине серии N с помощью удаленного рабочего стола.

  2. Скачайте, извлеките и установите поддерживаемый драйвер для своей операционной системы Windows.

После установки драйвера GRID на виртуальной машине ее требуется перезагрузить. После установки драйвера CUDA перезапуск не требуется.

Проверка установки драйверов

Обратите внимание, что панель управления Nvidia доступна только при установке драйвера GRID. Если установлены драйверы CUDA, панель управления NVIDIA отображаться не будет.

Установку драйвера можно проверить в диспетчере устройств. В следующем примере показана успешная конфигурация карты Tesla K80 на виртуальной машине Azure серии NC.

Свойства драйвера GPU

Чтобы запросить состояние устройства GPU, выполните служебную программу командной строки nvidia smi, установленную вместе с драйвером.

  1. Откройте командную строку и измените каталог на :\Program Files\NVIDIA Corporation\NVSMI.

  2. Выполните nvidia-smi. Если драйвер установлен, то отобразятся выходные данные, аналогичные приведенным ниже. GPU-Util отобразит 0 %, если только в этот момент графический процессор не выполняет рабочую нагрузку на виртуальной машине. Версия драйвера и сведения о GPU могут отличаться от показанных на изображении.

Состояние устройства NVIDIA

Сетевое подключение RDMA

Сетевое подключение RDMA можно включить на виртуальных машинах серии N с поддержкой RDMA, таких как NC24r, развернутых в одной группе доступности или в одной группе размещения в масштабируемом наборе виртуальных машин. Необходимо добавить расширение HpcVmDrivers для установки драйверов сетевых устройств Windows, обеспечивающих подключения RDMA. Чтобы в виртуальную машину серии N с поддержкой RDMA добавить расширение виртуальной машины, используйте командлеты Azure PowerShell для Azure Resource Manager.

Чтобы установить последнюю версию расширения HpcVMDrivers 1.1 на существующую виртуальную машину myVM с поддержкой RDMA, размещенную в регионе "Западная часть США", выполните следующее.

Set-AzVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "HpcVmDrivers" -Publisher "Microsoft.HpcCompute" -Type "HpcVmDrivers" -TypeHandlerVersion "1.1"

Дополнительные сведения см. в разделе Обзор расширений и компонентов виртуальной машины под управлением Windows.

Сеть RDMA поддерживает трафик MPI (Message Passing Interface) для приложений, использующих Microsoft MPI или Intel MPI 5.x.

Дальнейшие действия

  • Разработчики приложений с ускорением GPU, предназначенных для графических процессоров NVIDIA Tesla, могут также скачать и установить последнюю версию CUDA Toolkit. Дополнительные сведения см. в руководстве по установке CUDA.