A HB sorozatú virtuális gépek áttekintéseHB-series virtual machines overview

A nagy teljesítményű számítási (HPC-) alkalmazások teljesítményének maximalizálása az AMD-EPYC az átgondolt megközelítéssel, a memória helyi és a feldolgozásával kapcsolatos eljárás szükséges.Maximizing high performance compute (HPC) application performance on AMD EPYC requires a thoughtful approach memory locality and process placement. Az alábbiakban felvázoljuk az AMD EPYC architektúráját és az Azure-ban a HPC-alkalmazások megvalósítását.Below we outline the AMD EPYC architecture and our implementation of it on Azure for HPC applications. A "pNUMA" kifejezést fogjuk használni egy fizikai NUMA-tartományra, és a "vNUMA" kifejezésre hivatkozva egy virtualizált NUMA-tartományra.We will use the term “pNUMA” to refer to a physical NUMA domain, and “vNUMA” to refer to a virtualized NUMA domain.

Fizikailag a HB sorozat 2 * 32-Core EPYC 7551 processzor, összesen 64 fizikai maggal.Physically, an HB-series is 2 * 32-core EPYC 7551 CPUs for a total of 64 physical cores. Ezek a 64-es magok 16 pNUMA tartományra vannak osztva (szoftvercsatornán 8), amelyek mindegyike négy mag és más néven "CPU-komplex" (vagy "CCX").These 64 cores are divided into 16 pNUMA domains (8 per socket), each of which is four cores and known as a “CPU Complex” (or “CCX”). Minden CCX saját L3-gyorsítótárral rendelkezik, ami azt szemlélteti, hogy az operációs rendszer egy pNUMA/vNUMA határt fog látni.Each CCX has its own L3 cache, which is how an OS will see a pNUMA/vNUMA boundary. A szomszédos CCXs pár két fizikai DRAM-csatornához (32 GB, HB-sorozatú kiszolgálókon) érhető el.A pair of adjacent CCXs shares access to two channels of physical DRAM (32 GB of DRAM in HB-series servers).

Ha biztosítani szeretné, hogy az Azure hypervisor a virtuális gép beavatkozása nélkül működjön, fenntartjuk a fizikai pNUMA tartomány 0 (az első CCX).To provide room for the Azure hypervisor to operate without interfering with the VM, we reserve physical pNUMA domain 0 (the first CCX). Ezután hozzárendeljük a virtuális gép 1-15-as pNUMA-tartományát (a fennmaradó CCX-egységeket).We then assign pNUMA domains 1-15 (the remaining CCX units) for the VM. A virtuális gép a következőket fogja látni:The VM will see:

(15 vNUMA domains) * (4 cores/vNUMA) = 60magok száma virtuális gépenként(15 vNUMA domains) * (4 cores/vNUMA) = 60 cores per VM

Maga a virtuális gép nem tudja, hogy a pNUMA 0 nem lett megadva.The VM, itself, doesn't know that pNUMA 0 wasn't given to it. A virtuális gép a pNUMA 1-15-as vNUMA 0-14-et ismeri, 7 vNUMA pedig a VNUMA 1 vSocket 0 és 8 VSocket.The VM understands pNUMA 1-15 as vNUMA 0-14, with 7 vNUMA on vSocket 0 and 8 vNUMA on vSocket 1. Míg ez aszimmetrikus, az operációs rendszernek rendesen kell elindulnia és működnie.While this is asymmetrical, your OS should boot and operate normally. Az útmutató későbbi részében megtanítjuk, hogyan futtathatnak MPI-alkalmazásokat ezen az aszimmetrikus NUMA-elrendezésen.Later in this guide, we instruct how best to run MPI applications on this asymmetric NUMA layout.

A folyamat rögzítése a HB sorozatú virtuális gépeken fog működni, mivel a mögöttes szilíciumot a vendég virtuális géphez tesszük elérhetővé.Process pinning will work on HB-series VMs because we expose the underlying silicon as-is to the guest VM. Erősen ajánlott az optimális teljesítmény és konzisztencia érdekében feldolgozni a rögzítést.We strongly recommend process pinning for optimal performance and consistency.

További információ az AMD EPYC architektúráról és a LinkedIn többplatformos architektúráról .See more on AMD EPYC architecture and multi-chip architectures on LinkedIn. További részletekért tekintse meg a HPC hangolási útmutató az AMD EPYC processzorokhozcímű témakört.For more detailed information, see the HPC Tuning Guide for AMD EPYC Processors.

Az alábbi ábrán az Azure Hypervisorhoz és a HB sorozatú virtuális géphez fenntartott magok elkülönítése látható.The following diagram shows the segregation of cores reserved for Azure Hypervisor and the HB-series VM.

Az Azure hypervisor és a HB sorozatú virtuális gép számára fenntartott magok elkülönítése

HardverspecifikációkHardware specifications

HW-specifikációkHW Specifications HB sorozatú virtuális gépHB-series VM
CoresCores 60 (SMT letiltva)60 (SMT disabled)
CPUCPU AMD EPYC 7551 *AMD EPYC 7551*
CPU-gyakoriság (nem AVX)CPU Frequency (non-AVX) ~ 2,55 GHz (egyetlen és minden mag)~2.55 GHz (single + all cores)
Memory (Memória)Memory 4 GB/mag (240 összesen)4 GB/core (240 total)
Helyi lemezLocal Disk 700 GB NVMe700 GB NVMe
InfiniBandInfiniband 100 GB EDR Mellanox ConnectX-5 * *100 Gb EDR Mellanox ConnectX-5**
Network (Hálózat)Network 50 GB Ethernet (40 GB használható) Azure második Gen SmartNIC * * *50 Gb Ethernet (40 Gb usable) Azure second Gen SmartNIC***

Szoftverek specifikációiSoftware specifications

SW-specifikációkSW Specifications HB sorozatú virtuális gépHB-series VM
MPI-feladatok maximális méreteMax MPI Job Size 6000 mag (100 virtuálisgép-méretezési csoportok) 12000 magok (200 virtuálisgép-méretezési készletek)6000 cores (100 virtual machine scale sets) 12000 cores (200 virtual machine scale sets)
MPI-támogatásMPI Support MVAPICH2, OpenMPI, MPICH, platform MPI, Intel MPIMVAPICH2, OpenMPI, MPICH, Platform MPI, Intel MPI
További keretrendszerekAdditional Frameworks Egyesített kommunikáció X, libfabric, PGASUnified Communication X, libfabric, PGAS
Azure Storage-támogatásAzure Storage Support STD + prémium (max. 4 lemez)Std + Premium (max 4 disks)
Operációs rendszer támogatása a CSATOLÓJÁHOZ nincs SR RDMAOS Support for SRIOV RDMA CentOS/RHEL 7.6 +, SLES 12 SP4 +, WinServer 2016 +CentOS/RHEL 7.6+, SLES 12 SP4+, WinServer 2016+
Azure CycleCloud-támogatásAzure CycleCloud Support IgenYes
Azure Batch támogatásAzure Batch Support IgenYes

Következő lépésekNext steps

  • További információ az Azure-beli Linux és Windows rendszerhez készült HPC VM-méretekről.Learn more about HPC VM sizes for Linux and Windows in Azure.

  • További információ az Azure-beli HPC szolgáltatásról.Learn more about HPC in Azure.