Přehled virtuálních počítačů řady HB

Upozornění

Tento článek odkazuje na CentOS, linuxovou distribuci, která se blíží stavu Konec životnosti (EOL). Zvažte své použití a odpovídajícím způsobem naplánujte. Další informace najdete v doprovodných materiálech CentOS End Of Life.

Platí pro: ✔️ Virtuální počítače s Windows s Linuxem ✔️ ✔️ – Flexibilní škálovací sady Uniform Scale Sets ✔️

Maximalizace výkonu aplikací vysokovýkonného výpočetního prostředí (HPC) v AMD EPYC vyžaduje promyšlenou lokalitu paměti a umístění procesů. Níže si projdeme architekturu AMD EPYC a naši implementaci v Azure pro aplikace HPC. K odkazu na fyzickou doménu NUMA použijeme výraz "pNUMA" a "vNUMA" odkazujeme na virtualizovanou doménu NUMA.

Server řady HB-series je fyzicky 2 * 32jádrový procesor EPYC 7551 pro celkem 64 fyzických jader. Těchto 64 jader je rozděleno do 16 domén pNUMA (8 na soket), z nichž každý je čtyři jádra a označuje se jako "CPU Complex" (neboli "CCX"). Každý CCX má vlastní mezipaměť L3, což je způsob, jakým operační systém uvidí hranice pNUMA/vNUMA. Dvojice sousedních CCXs sdílí přístup ke dvěma kanálům fyzickéHO DRAM (32 GB DRAM na serverech řady HB-series).

Abychom zajistili prostor pro provoz hypervisoru Azure bez narušení virtuálního počítače, vyhrazujeme si fyzickou doménu pNUMA 0 (první CCX). Potom pro virtuální počítač přiřadíme domény pNUMA 1–15 (zbývající jednotky CCX). Virtuální počítač uvidí:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 Jádra na virtuální počítač

Samotný virtuální počítač neví, že mu pNUMA 0 nebylo přiděleno. Virtuální počítač rozumí pNUMA 1-15 jako vNUMA 0-14, s 7 vNUMA na vSocket 0 a 8 vNUMA na vSocket 1. I když je to asymetrický, operační systém by se měl spouštět a normálně fungovat. Dále v této příručce dáváme pokyn, jak nejlépe spouštět aplikace MPI v tomto asymetrického rozložení NUMA.

Připnutí procesu bude fungovat na virtuálních počítačích řady HB-series, protože zveřejníme základní silicon tak, jak je pro hostovaný virtuální počítač. Důrazně doporučujeme připnout proces pro optimální výkon a konzistenci.

Následující diagram znázorňuje oddělení jader vyhrazených pro Azure Hypervisor a virtuální počítač řady HB-series.

Oddělení jader rezervovaných pro virtuální počítač Azure Hypervisor a HB-series

Specifikace hardwaru

Specifikace hardwaru Virtuální počítač řady HB-series
Cores 60 (SMT zakázáno)
Procesor AMD EPYC 7551
Frekvence procesoru (bez AVX) ~2,55 GHz (jedno + všechna jádra)
Memory (Paměť) 4 GB/jádro (celkem 240 GB)
Místní disk 700 GB SSD
Infiniband 100 Gb EDR Mellanox Připojení X-5
Síť 50 Gb Ethernetu (40 Gb využitelné) Azure second SmartNIC

Specifikace softwaru

Specifikace softwaru Virtuální počítač řady HB-series
Maximální velikost úlohy MPI 18000 jader (300 virtuálních počítačů ve škálovací sadě virtuálních počítačů s singlePlacementGroup=true)
Podpora MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, PLATFORMA MPI
Další architektury UCX, libfabric, PGAS
Podpora služby Azure Storage Disky Úrovně Standard a Premium (maximálně 4 disky)
Podpora operačního systému pro SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Podpora orchestratoru CycleCloud, Batch, AKS; Možnosti konfigurace clusteru

Důležité

Tento dokument odkazuje na verzi Linuxu, která se blíží nebo na konci životnosti (EOL). Zvažte aktualizaci na aktuálnější verzi.

Další kroky