您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn.

在支持 InfiniBand 的 H 系列和 N 系列 VM 上进行高性能计算High-performance computing on InfiniBand enabled H-series and N-series VMs

Azure 的支持 InfiniBand 的 H 系列和 N 系列 VM 旨在为各种实际 HPC 和 AI 工作负载提供领先的性能、消息传递接口 (MPI) 可伸缩性和成本效益。Azure's InfiniBand enabled H-series and N-series VMs are designed to deliver leadership-class performance, Message Passing Interface (MPI) scalability, and cost efficiency for a variety of real-world HPC and AI workloads. 这些高性能计算 (HPC) 优化 VM 用于解决科学和工程方面的一些计算密集程度最高的问题(如:流体动力学、地球建模、天气模拟等)。These high-performance computing (HPC) optimized VMs are used to solve some of the most computationally intensive problems in science and engineering such as: fluid dynamics, earth modeling, weather simulations, etc.

这些文章介绍如何在 Azure 上开始使用支持 InfiniBand 的 H 系列和 N 系列 VM,以及在 VM 上开始使用 HPC 和 AI 工作负载进行优化配置来实现可伸缩性。These articles describe how to get started on the InfiniBand-enabled H-series and N-series VMs on Azure as well as optimal configuration of the HPC and AI workloads on the VMs for scalability.

特性和功能Features and capabilities

支持 InfiniBand 的 H 系列和 N 系列 VM 旨在为 HPC 工作负载提供最佳 HPC 性能、MPI 可伸缩性和成本效益。The InfiniBand enabled H-series and N-series VMs are designed to provide the best HPC performance, MPI scalability, and cost efficiency for HPC workloads. 请参阅 H 系列N 系列 VM,以详细了解 VM 的特性和功能。See H-series and N-series VMs to learn more about the features and capabilities of the VMs.

RDMA 和 InfiniBandRDMA and InfiniBand

支持 RDMA 的 H 系列N 系列 VM 通过低延迟的高带宽 InfiniBand 网络进行通信。RDMA capable H-series and N-series VMs communicate over the low latency and high bandwidth InfiniBand network. 此类互连上的 RDMA 功能对于提高分布式节点 HPC 和 AI 工作负载的可伸缩性和性能至关重要。The RDMA capability over such an interconnect is critical to boost the scalability and performance of distributed-node HPC and AI workloads. 支持 InfiniBand 的 H 系列和 N 系列 VM 采用非阻塞性胖树进行连接,使用的小直径旨在实现一致的优化 RDMA 性能。The InfiniBand enabled H-series and N-series VMs are connected in a non-blocking fat tree with a low-diameter design for optimized and consistent RDMA performance. 请参阅启用 InfiniBand,详细了解如何在支持 InfiniBand 的 VM 上设置 InfiniBand。See Enable InfiniBand to learn more about setting up InfiniBand on the InfiniBand enabled VMs.

消息传递接口Message passing interface

支持 SR-IOV 的 H 系列和 N 系列几乎支持所有 MPI 库和版本。The SR-IOV enabled H-series and N-series support almost all MPI libraries and versions. 部分受支持的最常用 MPI 库如下:Intel MPI、OpenMPI、MPICH、MVAPICH2、平台 MPI 以及所有远程直接内存访问 (RDMA) 谓词。Some of the most common, supported MPI libraries are: Intel MPI, OpenMPI, MPICH, MVAPICH2, Platform MPI, and all remote direct memory access (RDMA) verbs. 请参阅设置 MPI,详细了解如何安装各种受支持的 MPI 库及其最佳配置。See Set up MPI to learn more about installing various supported MPI libraries and their optimal configuration.

入门Get started

第一步是基于 VM 规范和 RDMA 功能选择对工作负载最佳的 H 系列N 系列 VM 类型。The first step is to select the H-series and N-series VM type optimal for the workload based on the VM specifications and RDMA capability. 其次,通过启用 InfiniBand 来配置 VM。Second, configure the VM by enabling InfiniBand. 可通过各种方法实现此目的,包括使用内嵌驱动程序的优化 VM 映像;有关详细信息,请参阅针对 Linux 进行优化启用 InfiniBandThere are various methods to doing this including using optimized VM images with drivers baked-in; see Optimization for Linux and Enable InfiniBand for details. 第三,对于分布式节点工作负载,选择和配置 MPI 至关重要。Third, for distributed node workloads, choosing and configuring MPI is critical. 有关详细信息,请参阅设置 MPISee Set up MPI for details. 第四,为了提高性能和可伸缩性,请按照特定于 VM 系列的指导(如 HB 系列概述HC 系列概述)对工作负载进行优化配置。Fourth, for performance and scalability, optimally configure the workloads by following guidance specific to the VM family, such as for HB-series overview and HC-series overview.

后续步骤Next steps