Obliczenia o wysokiej wydajności na maszynach wirtualnych serii H i N z włączoną obsługą standardu InfiniBand

Dotyczy: Maszyny wirtualne ✔️ z systemem Linux Windows ✔️ maszyn ✔️ wirtualnych Elastyczne zestawy skalowania Jednolite ✔️ zestawy skalowania

Maszyny wirtualne serii H i N z włączoną obsługą technologii InfiniBand platformy Azure zaprojektowano w celu zapewnienia wydajności klasy kierowniczej, skalowalności Message Passing Interface (MPI) i efektywności kosztowej dla różnych rzeczywistych obciążeń HPC i AI. Te maszyny wirtualne zoptymalizowane pod kątem obliczeń o wysokiej wydajności (HPC) są używane do rozwiązywania niektórych z najbardziej wymagających obliczeń problemów w nauce i inżynierii, takich jak dynamika płynów, modelowanie ziemi, symulacje pogodowe itp.

W tych artykułach opisano, jak rozpocząć pracę na maszynach wirtualnych z serii H i N z włączoną obsługą technologii InfiniBand na platformie Azure, a także jak uzyskać optymalną konfigurację obciążeń HPC i AI na tych maszynach wirtualnych w celu zapewnienia skalowalności.

Funkcje i możliwości

Maszyny wirtualne serii H i N z włączoną obsługą technologii InfiniBand zaprojektowano w celu zapewnienia najlepszej wydajności HPC, skalowalności MPI i efektywności kosztowej dla obciążeń HPC. Zobacz maszyny wirtualne serii H i N , aby dowiedzieć się więcej o funkcjach i możliwościach maszyn wirtualnych.

RDMA i InfiniBand

Maszyny wirtualne serii H i N z serii RDMA komunikują się za pośrednictwem sieci InfiniBand o małych opóźnieniach i dużej przepustowości. Możliwość RDMA za pośrednictwem takiego połączenia wzajemnego ma kluczowe znaczenie dla zwiększenia skalowalności i wydajności obciążeń HPC i AI w węzłach rozproszonych. Maszyny wirtualne z serii H i N z włączoną obsługą technologii InfiniBand są połączone w nieblokowym drzewie fat z niskim poziomem projektu w celu zapewnienia zoptymalizowanej i spójnej wydajności RDMA. Zobacz Enable InfiniBand (Włączanie sieci InfiniBand ), aby dowiedzieć się więcej na temat konfigurowania sieci InfiniBand na maszynach wirtualnych z włączoną obsługą infiniBand.

Interfejs przekazywania komunikatów

Seria H z obsługą funkcji SR-IOV i seria N obsługują prawie wszystkie biblioteki i wersje MPI. Niektóre z najczęściej używanych bibliotek MPI to: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPI. Obsługiwane są wszystkie czasowniki zdalnego bezpośredniego dostępu do pamięci (RDMA). Zobacz Konfigurowanie mpi, aby dowiedzieć się więcej o instalowaniu różnych obsługiwanych bibliotek MPI i ich optymalnej konfiguracji.

Rozpoczęcie pracy

Pierwszym krokiem jest wybranie typu maszyny wirtualnej serii H i serii N optymalnego dla obciążenia na podstawie specyfikacji maszyny wirtualnej i możliwości RDMA. Po drugie skonfiguruj maszynę wirtualną, włączając sieć InfiniBand. Istnieją różne metody, w tym użycie zoptymalizowanych obrazów maszyn wirtualnych ze sterownikami. Aby uzyskać szczegółowe informacje, zobacz Optymalizacja dla systemu Linux i Włączanie infiniBand . Po trzecie, w przypadku obciążeń węzłów rozproszonych wybór i odpowiednie skonfigurowanie infrastruktury MPI ma kluczowe znaczenie. Aby uzyskać szczegółowe informacje, zobacz Konfigurowanie mpi . Po czwarte, aby uzyskać wydajność i skalowalność, należy optymalnie skonfigurować obciążenia, korzystając ze wskazówek specyficznych dla rodziny maszyn wirtualnych, takich jak omówienie serii HBv3 i omówienie serii HC.

Następne kroki