Panoramica delle macchine virtuali serie HC

Attenzione

Questo articolo fa riferimento a CentOS, una distribuzione Linux prossima allo stato EOL (End of Life, fine del ciclo di vita). Prendere in considerazione l'uso e il piano di conseguenza. Per altre informazioni, vedere le linee guida per la fine della vita di CentOS.

Si applica a: ✔️ macchine virtuali Linux ✔️ macchine virtuali Windows ✔️ set di scalabilità flessibili ✔️ set di scalabilità uniformi

L'ottimizzazione delle prestazioni delle applicazioni HPC nei processori scalabili Intel Xeon richiede un approccio ponderato per elaborare il posizionamento in questa nuova architettura. Di seguito viene illustrata l'implementazione di questa nelle macchine virtuali serie HC di Azure per le applicazioni HPC. Si userà il termine "pNUMA" per fare riferimento a un dominio NUMA fisico e a "vNUMA" per fare riferimento a un dominio NUMA virtualizzato. Analogamente, si userà il termine "pCore" per fare riferimento a core CPU fisici e "vCore" per fare riferimento ai core CPU virtualizzati.

Fisicamente, un server serie HC è 2 * 24 core Intel Xeon Platinum 8168 CPU per un totale di 48 core fisici. Ogni CPU è un singolo dominio pNUMA e ha accesso unificato a sei canali di DRAM. Le CPU Intel Xeon Platinum includono una cache L2 4 volte superiore rispetto alle generazioni precedenti (256 KB/core -> 1 MB/core), riducendo anche la cache L3 rispetto alle CPU Intel precedenti (2,5 MB/core -> 1,375 MB/core).

La topologia precedente passa anche alla configurazione dell'hypervisor della serie HC. Per fornire spazio per il funzionamento dell'hypervisor di Azure senza interferire con la macchina virtuale, si riservano pCore 0-1 e 24-25 (ovvero i primi 2 pCore su ogni socket). Verranno quindi assegnati domini pNUMA a tutti i core rimanenti alla macchina virtuale. Di conseguenza, la macchina virtuale visualizzerà:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 core per macchina virtuale

La macchina virtuale non conosce che non sono stati assegnati pCore 0-1 e 24-25. Espone quindi ogni vNUMA come se avesse 22 core in modo nativo.

Le CPU Intel Xeon Platinum, Gold e Silver introducono anche una rete mesh 2D on-die per la comunicazione all'interno e all'esterno del socket DELLA CPU. È consigliabile aggiungere processi per ottenere prestazioni e coerenza ottimali. L'aggiunta del processo funzionerà sulle macchine virtuali serie HC perché il processore sottostante viene esposto così come è alla macchina virtuale guest.

Il diagramma seguente illustra la separazione dei core riservati per Hypervisor di Azure e la macchina virtuale serie HC.

Separazione dei core riservati per macchine virtuali hypervisor e serie HC di Azure

Specifiche hardware

Specifiche hardware Macchina virtuale serie HC
Core 44 (HT disabilitato)
CPU Intel Xeon Platinum 8168
Frequenza CPU (non AVX) 3,7 GHz (core singolo), 2,7-3,4 GHz (tutti i core)
Memoria 8 GB/core (352 totale)
Disco locale SSD da 700 GB
Infiniband 100 Gb EDR Mellanox Connessione X-5
Rete 50 Gb Ethernet (utilizzabile da 40 GB) SmartNIC di seconda generazione di Azure

Specifiche software

Specifiche software Macchina virtuale serie HC
Dimensioni massime processo MPI 13200 core (300 macchine virtuali in un singolo set di scalabilità di macchine virtuali con singlePlacementGroup=true)
Supporto MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Framework aggiuntivi UCX, libfabric, PGAS
supporto Archiviazione di Azure Dischi Standard e Premium (massimo 4 dischi)
Supporto del sistema operativo per SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Supporto di Orchestrator CycleCloud, Batch, servizio Azure Kubernetes; Opzioni di configurazione del cluster

Importante

Questo documento fa riferimento a una versione di Rilascio di Linux vicina o alla fine della vita (EOL). Prendere in considerazione l'aggiornamento a una versione più recente.

Passaggi successivi

  • Altre informazioni sull'architettura intel Xeon SP.
  • Per informazioni sugli annunci più recenti, sugli esempi di carico di lavoro HPC e sui risultati delle prestazioni, vedere i blog della community tecnica di calcolo di Azure.
  • Per un quadro generale sull'architettura per l'esecuzione di carichi di lavoro HPC, vedere HPC (High Performance Computing) in Azure.