Calcolo ad alte prestazioni nelle macchine virtuali serie HB e serie N abilitate per HB e serie N

Si applica a: ✔️ Macchine ✔️ virtuali Linux Macchine virtuali ✔️ Windows Set di scalabilità flessibili Set di scalabilità ✔️ Uniform

Le macchine virtuali serie H e serie N abilitate per InfiniBand di Azure sono progettate per offrire prestazioni senza confronti, scalabilità MPI (Message Passing Interface) e convenienza per una varietà di carichi di lavoro HPC reali e di intelligenza artificiale. Queste VM ottimizzate per HPC (High Performance Computing) vengono usate per risolvere alcuni problemi che comportano un utilizzo elevato delle risorse di calcolo nel campo delle scienze e dell'ingegneria, come la fluidodinamica, la modellazione geologica, le simulazioni meteorologiche e così via.

Questi articoli forniscono informazioni introduttive sulle macchine virtuali serie H e serie N abilitate per InfiniBand in Azure e sulla configurazione ottimale dei carichi di lavoro HPC e di intelligenza artificiale nelle VM ai fini della scalabilità.

Funzionalità e caratteristiche

Le macchine virtuali serie HB e serie N abilitate per InfiniBand sono progettate per offrire le migliori prestazioni HPC, scalabilità MPI e efficienza dei costi per i carichi di lavoro HPC. Per altre informazioni sulle funzionalità e sulle funzionalità delle macchine virtuali della serie HB e delle macchine virtuali serie N, vedere HB-series e macchine virtuali serie N.

RDMA e InfiniBand

Le macchine virtuali serie HB e serie Ncon supporto per RDMA comunicano sulla rete InfiniBand a bassa latenza e alta larghezza di banda. La funzionalità RDMA su un'interconnessione di questo tipo è fondamentale per migliorare la scalabilità e le prestazioni dei carichi di lavoro HPC e di intelligenza artificiale su nodi distribuiti. Le macchine virtuali serie H e serie N abilitate per InfiniBand sono connesse in strutture Fat Tree non bloccanti a diametro ridotto per prestazioni RDMA ottimizzate e coerenti. Per altre informazioni sulla configurazione di InfiniBand nelle macchine virtuali abilitate per Infiniband, vedere Abilitare InfiniBand.

Message Passing Interface

La serie HB abilitata per SR-IOV e serie N supporta quasi tutte le librerie e le versioni MPI. Alcune delle librerie MPI più comunemente usate sono: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPI. Sono supportati tutti i verbi rdMA (Remote Direct Memory Access). Per altre informazioni sull'installazione delle varie librerie MPI supportate e sulla relativa configurazione ottimale, vedere Configurare MPI.

Introduzione

Il primo passaggio consiste nel selezionare il tipo di macchina virtuale serie HB e serie N ottimale per il carico di lavoro in base alle specifiche della macchina virtuale e alla funzionalità RDMA. Occorre poi configurare la VM abilitando InfiniBand. A questo scopo sono disponibili vari metodi, tra cui l'uso di immagini di VM ottimizzate con driver incorporati. Per altre informazioni, vedere Ottimizzazione per Linux e Abilitare InfiniBand. In terzo luogo, per i carichi di lavoro dei nodi distribuiti, la scelta e la configurazione di MPI in modo appropriato è fondamentale. Per altre informazioni, vedere Configurare MPI. Quarto, per prestazioni e scalabilità, configurare in modo ottimale i carichi di lavoro seguendo indicazioni specifiche per la famiglia di macchine virtuali, ad esempio per la panoramica della serie HBv3 e la panoramica della serie HC.

Passaggi successivi