你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
GPU 优化虚拟机大小
适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集
提示
请尝试使用虚拟机选择器工具查找最适合你的工作负载的其他尺寸。
GPU 优化 VM 大小是具有单个、多个或部分 GPU 的专用虚拟机。 这些大小是针对计算密集型、图形密集型和可视化工作负荷设计的。 本文介绍有关 GPU、vCPU、数据磁盘和 NIC 的数量和类型的信息。 此分组中的每个大小还包括存储吞吐量及网络带宽。
NCv3 系列和 NC T4_v3 系列大小针对计算密集型 GPU 加速的应用程序进行了优化。 一些示例包括基于 CUDA 和 OpenCL 的应用程序以及模拟、AI 和深度学习。 NC T4 v3 系列专用于采用 NVIDIA Tesla T4 GPU 和 AMD EPYC2 Rome 处理器的推理工作负荷。 NCv3 系列带有 NVIDIA Tesla V100 GPU,专用于高性能计算和 AI 工作负载。
NC 100 v4 系列大小侧重于中型 AI 训练和批量推理工作负载。 使用 NC A100 v4 系列,可以灵活地为每台 VM 选择一个、两个或四个 NVIDIA A100 80GB PCIe Tensor Core GPU,以将合适大小的 GPU 加速用于工作负载。
ND A100 v4 系列大小侧重于纵向扩展和横向扩展深度学习训练以及加速的 HPC 应用程序。 ND A100 v4 系列使用 8 个 NVIDIA A100 TensorCore GPU,每个 GPU 都配备 200 千兆位 Mellanox InfiniBand HDR 连接和 40 GB GPU 内存。
NGads V620 系列 VM 大小针对 Azure 中托管的高性能交互式游戏体验进行了优化。 此系列虚拟机由 AMD Radeon PRO V620 GPU 和 AMD EPYC 7763 (Milan) CPU 提供支持。
NV 系列和 NVv3 系列大小已针对使用框架(如 OpenGL 和 DirectX)的远程可视化、流式处理、游戏、编码和 VDI 方案进行了优化和设计。 这些 VM 由 NVIDIA Tesla M60 GPU 提供支持。
NVv4 系列 VM 大小已针对 VDI 和远程可视化进行了优化和设计。 NVv4 具有已分区的 GPU,可为需要较少 GPU 资源的工作负载提供适当的大小。 这些 VM 由 AMD Radeon Instinct MI25 GPU 提供支持。 NVv4 VM 目前只支持 Windows 来宾操作系统。
NDm A100 v4 系列虚拟机是 Azure GPU 系列的新增旗舰,专为高端深度学习训练以及紧密耦合的纵向扩展和横向扩展 HPC 工作负载而设计。 NDm A100 v4 系列的起步配置是一个虚拟机 (VM) 和八个 NVIDIA Ampere A100 80GB Tensor Core GPU。
支持的操作系统和驱动程序
若要利用 Azure N 系列 VM 的 GPU 功能,必须安装 NVIDIA 或 AMD GPU 驱动程序。
对于 NVIDIA GPU 支持的 VM,NVIDIA GPU 驱动程序扩展会安装相应的 NVIDIA CUDA 或 GRID 驱动程序。 请使用 Azure 门户或工具(例如 Azure PowerShell 或 Azure 资源管理器模板)安装或管理该扩展。 有关受支持的操作系统和部署步骤,请参阅 NVIDIA GPU 驱动程序扩展文档。 有关 VM 扩展的常规信息,请参阅 Azure 虚拟机扩展和功能。
或者,你也可以手动安装 NVIDIA GPU 驱动程序。 请参阅在运行 Windows 的 N 系列 VM 上安装 NVIDIA GPU 驱动程序或在运行 Linux 的 N 系列 VM 上安装 NVIDIA GPU 驱动程序,以了解受支持的操作系统、驱动程序以及安装和验证步骤。
对于 AMD GPU 支持的 VM,AMD GPU 驱动程序扩展 会安装相应的 AMD 驱动程序。 请使用 Azure 门户或工具(例如 Azure PowerShell 或 Azure 资源管理器模板)安装或管理该扩展。 有关 VM 扩展的常规信息,请参阅 Azure 虚拟机扩展和功能。
或者,你也可以手动安装 AMD GPU 驱动程序。 请参阅在运行 Windows 的 N 系列 VM 上安装 AMD GPU 驱动程序,以了解受支持的操作系统、驱动程序、安装和验证步骤。
部署注意事项
有关 N 系列 VM 的可用性,请查看可用产品(按区域)。
N 系列 VM 只能按 Resource Manager 部署模型部署。
N 系列的 VM 在对其磁盘支持的 Azure 存储类型方面有所不同。 NC 和 NV VM 仅支持标准磁盘存储 (HDD) 所支持的 VM 磁盘。 所有其他 GPU VM 都支持由标准磁盘存储和高级磁盘存储 (SSD) 支持的 VM 磁盘。
如果需要部署的 N 系列 VM 较多,请考虑使用即用即付订阅或其他购买选项。 如果使用的是 Azure 免费帐户,则仅可以使用有限数量的 Azure 计算核心。
可能需要提高 Azure 订阅中的核心配额(按区域)以及单独针对 NC、NCv2、NCv3、ND、NDv2、NV 或 NVv2 核心的配额。 若要请求增加配额,可免费 建立联机客户支持请求 。 默认限制可能因订阅类别而异。
其他大小
后续步骤
了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。