HB sorozatú virtuális gépek áttekintése

Figyelemfelhívás

Ez a cikk a CentOS-ra, egy olyan Linux-disztribúcióra hivatkozik, amely közel áll az élettartam (EOL) állapotához. Fontolja meg a használatát, és ennek megfelelően tervezze meg. További információ: CentOS End Of Life útmutató.

A következőkre vonatkozik: ✔️ Linux rendszerű virtuális gépek ✔️ Windows rendszerű virtuális gépek Rugalmas méretezési ✔️ csoportok ✔️ Egységes méretezési csoportok

A nagy teljesítményű számítási (HPC) alkalmazások teljesítményének maximalizálása az AMD EPYC-n átgondolt megközelítést igényel a memória helyének és a folyamat elhelyezésének. Az alábbiakban bemutatjuk az AMD EPYC architektúráját és implementálását az Azure for HPC-alkalmazásokhoz. A "pNUMA" kifejezéssel egy fizikai NUMA-tartományra, a "vNUMA" pedig virtualizált NUMA-tartományra hivatkozunk.

Fizikailag egy HB-sorozatú kiszolgáló 2 * 32 magos EPYC 7551 PROCESSZOR, összesen 64 fizikai maghoz. Ez a 64 mag 16 pNUMA tartományra van osztva (szoftvercsatornánként 8), amelyek mindegyike négy magból áll, és "CPU Complex" (vagy "CCX") néven ismert. Minden CCX saját L3-gyorsítótárral rendelkezik, így egy operációs rendszer pNUMA/vNUMA határt fog látni. A szomszédos CCX-ek párja két fizikai DRAM-csatornához (32 GB DRAM A HB-sorozatú kiszolgálókon) fér hozzá.

Annak érdekében, hogy az Azure-hipervizor a virtuális gép zavarása nélkül működjön, fenntartjuk a 0. fizikai pNUMA tartományt (az első CCX-et). Ezután 1–15 pNUMA tartományt (a fennmaradó CCX-egységeket) rendelünk hozzá a virtuális géphez. A virtuális gép a következőt fogja látni:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 magok virtuális gépenként

Maga a virtuális gép nem tudja, hogy a pNUMA 0-t nem kapta meg. A virtuális gép a pNUMA 1-15-öt 0-14 vNUMA-ként értelmezi, a vSocket 0 7 vNUMA és 8 vNUMA a vSocket 1-en. Bár ez aszimmetrikus, az operációs rendszernek normál módon kell elindulnia és működnie. Az útmutató későbbi részében bemutatjuk, hogyan futtathat a legjobban MPI-alkalmazásokat ezen az aszimmetrikus NUMA-elrendezésen.

A folyamat rögzítése HB sorozatú virtuális gépeken működik, mivel a mögöttes szilíciumot a vendég virtuális gép számára tesszük elérhetővé. Határozottan javasoljuk a folyamat rögzítését az optimális teljesítmény és konzisztencia érdekében.

Az alábbi ábra az Azure Hypervisorhoz és a HB-sorozatú virtuális géphez fenntartott magok elkülönítését mutatja be.

Az Azure Hypervisorhoz és HB-sorozatú virtuális géphez fenntartott magok elkülönítése

Hardverspecifikációk

Hardverspecifikációk HB sorozatú virtuális gép
Cores 60 (SMT letiltva)
CPU AMD EPYC 7551
CPU-gyakoriság (nem AVX) ~2,55 GHz (egyetlen + minden mag)
Memory (Memória) 4 GB/mag (összesen 240 GB)
Helyi lemez 700 GB SSD
Infiniband 100 Gb Végponti észlelés és reagálás Mellanox Csatlakozás X-5
Network (Hálózat) 50 Gb Ethernet (40 Gb használható) Azure második generációs SmartNIC

Szoftverspecifikációk

Szoftverspecifikációk HB sorozatú virtuális gép
MPI-feladatok maximális mérete 18000 mag (300 virtuális gép egyetlen virtuálisgép-méretezési csoportban a singlePlacementGroup=true használatával)
MPI-támogatás HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
További keretrendszerek UCX, libfabric, PGAS
Azure Storage-támogatás Standard és Prémium lemezek (legfeljebb 4 lemez)
SRIOV RDMA operációsrendszer-támogatás CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Orchestrator-támogatás CycleCloud, Batch, AKS; fürtkonfigurációs beállítások

Fontos

Ez a dokumentum a Linux egy olyan kiadási verziójára hivatkozik, amely az Élettartam vége (EOL) közelében vagy végén található. Fontolja meg a frissítés aktuálisabb verzióra való frissítését.

Következő lépések