HBv2 系列虛擬機器概觀

警告

本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據以考慮您的使用和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引

適用於: ✔️ Linux VM ✔️ Windows VM ✔️ 彈性擴展集✔️統一擴展集。

在 AMD EPYC 極大化高效能運算 (HPC) 應用程式效能,需要謹慎方法記憶體位置和流程放置。 以下概述 AMD EPYC 結構,與適用 HPC 應用程式在 Azure 上的運用。 "pNUMA" 一詞指的是實體 NUMA 網域,而 "vNUMA" 則指的是虛擬化 NUMA 網域。

實體上,HBv2 系列伺服器共有 128 個實體核心,分別為 2 個 64 核心的 EPYC 7V12 CPU。 HBv2 上已停用同時多線程 (SMT)。 這 128 個核心分成 16 個區段(每個套接字 8 個),每個區段包含 8 個處理器核心。 Azure HBv2 伺服器也會執行下列 AMD BIOS 設定:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

如此一來,伺服器就會以 4 個 NUMA 網域啟動 (每個通訊端 2 個),每個網域大小為 32 個核心。 每個 NUMA 都能直接存取 4 個以 3200 MT/秒運作的實體 DRAM 通道。

為了讓 Azure Hypervisor 擁有足夠空間,在不干擾 VM 的情況下運作,我們會為每個伺服器保留 8 個實體核心。

VM 拓撲

我們會在這兩個 CPU 套接字上對稱地保留這 8 個 Hypervisor 主機核心,從每個 NUMA 網域上從特定核心複雜 Dies (CCD) 取得前 2 個核心,並保留 HBv2 系列 VM 的其餘核心。 CCD 界限不等於 NUMA 界限。 在 HBv2 上,一組連續四個 (4) CCD 會設定為 NUMA 網域,無論是在主機伺服器層級還是客體 VM 內。 因此,所有 HBv2 VM 大小都會公開 4 個出現在 OS 和應用程式的 NUMA 網域。 4 個統一的 NUMA 網域,每個網域都有不同的核心數目,視特定 HBv2 VM 大小而定。

處理程序釘選會在 HBv2 系列 VM 上運作,因為我們會依原樣向客體 VM 公開基礎晶片。 強烈建議進行程序釘選以獲得最佳效能和一致性。

硬體規格

硬體規格 HBv2 系列 VM
核心 120 (SMT 已停用)
CPU AMD EPYC 7V12
CPU 頻率 (非 AVX) ~3.1 GHz (單一 + 所有核心)
記憶體 4 GB/核心 (總共 480 GB)
本機磁碟 960 GiB NVMe (區塊)、480 GB SSD (頁面檔)
Infiniband 200 Gb/s HDR Mellanox ConnectX-6
網路 50 Gb/秒 乙太網路 (40 Gb/秒 可用) Azure 第二代 SmartNIC

軟體規格

軟體規格 HBv2 系列 VM
MPI 工作大小上限 36000 核心 (singlePlacementGroup=true 的單一虛擬機器擴展集中的 300 個 VM)
MPI 支援 HPC-X、Intel MPI、OpenMPI、MVAPICH2、MPICH、Platform MPI
其他架構 UCX、libfabric、PGAS
Azure 儲存體支援 標準和進階磁碟 (最多 8 個磁碟)
SRIOV RDMA 的 OS 支援 CentOS/RHEL 7.9+、Ubuntu 18.04+、SLES 12 SP5+、WinServer 2016+
協調器支援 CycleCloud、Batch、AKS;叢集設定選項

注意

HBv2 和其他具有超過 64 個 (虛擬或實體) 核心的 VM 均不支援 Windows Server 2012 R2。 如需詳細資訊,請參閱 Windows Server 上 Hyper-V 支援的 Windows 客體作業系統

下一步