Rozmiary maszyn wirtualnych do obliczeń o wysokiej wydajności

Dotyczy: Maszyny ✔️ wirtualne z systemem Linux Windows ✔️ maszyn wirtualnych ✔️ Elastyczne zestawy skalowania Jednolite ✔️ zestawy skalowania

Porada

Wypróbuj narzędzie Selektor maszyn wirtualnych, aby znaleźć inne rozmiary, które najlepiej pasują do Twojego obciążenia.

Maszyny wirtualne serii H platformy Azure zostały zaprojektowane w celu zapewnienia wydajności, skalowalności i wydajności kosztowej klasy kierowniczej dla różnych rzeczywistych obciążeń HPC.

Seria HBv3 Maszyny wirtualne są zoptymalizowane pod kątem aplikacji HPC, takich jak dynamika płynów, jawna i niejawna analiza elementów skończonych, modelowanie pogody, przetwarzanie sejsmiczne, symulacja zbiorników i symulacja RTL. Maszyny wirtualne HBv3 mają do 120 rdzeni procesora CPU z serii AMD EPYC™ 7003 (DoBv3), 448 GB pamięci RAM i nie mają hiperwątkności. Maszyny wirtualne serii HBv3 zapewniają również przepustowość pamięci 350 GB/s, do 32 MB pamięci podręcznej L3 na rdzeń, do 7 GB/s wydajności dysków SSD urządzenia blokowego i częstotliwości zegara do 3,675 GHz.

Wszystkie maszyny wirtualne serii HBv3 są wyposażone w sieć NVIDIA InfiniBand o pojemności 200 Gb/s, co umożliwia obsługę obciążeń MPI o skali superkomputerów. Te maszyny wirtualne są połączone w nieblokuje drzewie grubym w celu zapewnienia zoptymalizowanej i spójnej wydajności RDMA. Sieć szkieletowa THE InfiniBand obsługuje również routing adaptacyjny i dynamiczny transport połączony (DCT, oprócz standardowych transportów RC i UD). Te funkcje zwiększają wydajność, skalowalność i spójność aplikacji, a ich użycie jest zdecydowanie zalecane.

Seria HBv2 Maszyny wirtualne są zoptymalizowane pod kątem aplikacji opartych na przepustowości pamięci, takich jak dynamika płynów, analiza elementów skończonych i symulacja zbiorników. Maszyny wirtualne HBv2 mają 120 rdzeni procesora AMD EPYC 7742, 4 GB pamięci RAM na rdzeń procesora CPU i nie mają jednoczesnego wielowątkowania. Każda maszyna wirtualna HBv2 zapewnia do 340 GB/s przepustowości pamięci i do 4 teraFTERAFTERAS mocy obliczeniowej FP64.

Maszyny wirtualne HBv2 mają 200 Gb/s Mellanox HB InfiniBand, podczas gdy maszyny wirtualne z serii HB i HC mają 100 Gb/s Mellanox EDR InfiniBand. Każdy z tych typów maszyn wirtualnych jest połączony w nieblokującym drzewie fat w celu zapewnienia zoptymalizowanej i spójnej wydajności RDMA. Maszyny wirtualne HBv2 obsługują routing adaptacyjny i dynamiczny transport połączony (DCT, oprócz standardowych transportów RC i UD). Te funkcje zwiększają wydajność, skalowalność i spójność aplikacji, a ich użycie jest zdecydowanie zalecane.

Seria HB Maszyny wirtualne są zoptymalizowane pod kątem aplikacji opartych na przepustowości pamięci, takich jak dynamika płynów, jawna analiza elementów skończonych i modelowanie pogody. Maszyny wirtualne HB mają 60 rdzeni procesora AMD EPYC 7551, 4 GB pamięci RAM na rdzeń procesora CPU i nie mają hiperwątkności. Platforma AMD EPYC zapewnia ponad 260 GB/s przepustowości pamięci.

Seria HC Maszyny wirtualne są zoptymalizowane pod kątem aplikacji opartych na obliczeniach gęstych, takich jak niejawna analiza elementów skończonych, dynamika molekularna i chemia obliczeniowa. Maszyny wirtualne HC są wyposażone w 44 rdzenie procesora Intel Xeon × 8168, 8 GB pamięci RAM na rdzeń procesora CPU i nie mają funkcji hiperwątkności. Platforma Intel Xeon Debian obsługuje bogaty ekosystem narzędzi programowych firmy Intel, takich jak Biblioteka jądra Intel Math.

Seria H Maszyny wirtualne są zoptymalizowane pod kątem aplikacji opartych na wysokich częstotliwościach procesora CPU lub dużych wymaganiach dotyczących pamięci na rdzeń. Maszyny wirtualne serii H mają 8 lub 16 rdzeni procesora Intel Xeon E5 2667 v3, 7 lub 14 GB pamięci RAM na rdzeń procesora CPU i nie mają funkcji hiperwątkowych. Seria H oferuje 56 Gb/s Mellanox FDR InfiniBand w nieblokowej konfiguracji drzewa fat w celu zapewnienia spójnej wydajności RDMA. Maszyny wirtualne serii H obsługują rozwiązania Intel MPI 5.x i MS-MPI.

Uwaga

Wszystkie maszyny wirtualne serii HBv3, HBv2, HB i HC mają wyłączny dostęp do serwerów fizycznych. Istnieje tylko 1 maszyna wirtualna na serwer fizyczny i nie ma współużytkowania wielu maszyn wirtualnych dla tych rozmiarów maszyn wirtualnych.

Uwaga

Maszyny wirtualne A8–A11 zostaną wycofane od 3.03.2021 r. Obecnie nie są możliwe żadne nowe wdrożenia maszyn wirtualnych o tych rozmiarach. Jeśli masz istniejące maszyny wirtualne, zapoznaj się z powiadomieniami w wiadomości e-mail, aby zapoznać się z kolejnymi krokami, w tym z migracją do innych rozmiarów maszyn wirtualnych w przewodniku migracji HPC.

Wystąpienia z obsługą technologii RDMA

Większość rozmiarów maszyn wirtualnych HPC ma interfejs sieciowy do zdalnego bezpośredniego dostępu do pamięci (RDMA). Wybrane rozmiary serii N oznaczone za pomocą "r" są również z możliwością RDMA. Ten interfejs jest dodatkiem do standardowego interfejsu sieciowego Azure Ethernet dostępnego w innych rozmiarach maszyn wirtualnych.

Ten interfejs pomocniczy umożliwia wystąpieniom z możliwością RDMA komunikowanie się za pośrednictwem sieci InfiniBand (IB) z użyciem stawek STANDARDU ETHERNET dla maszyn wirtualnych HBv3, HBv2 i EDR hb, HC, NDv2 i FDR dla maszyn wirtualnych H16r, H16mr i innych maszyn wirtualnych serii N z możliwością RDMA. Te możliwości RDMA mogą zwiększyć skalowalność i wydajność Message Passing Interface (MPI).

Uwaga

Obsługa funkcji SR-IOV: W usłudze Azure HPC obecnie istnieją dwie klasy maszyn wirtualnych w zależności od tego, czy włączono dla nich funkcję SR-IOV dla infiniBand. Obecnie prawie wszystkie maszyny wirtualne nowszej generacji z obsługą RDMA lub InfiniBand na platformie Azure są włączone przy użyciu funkcji SR-IOV z wyjątkiem maszyn H16r, H16mr i NC24r. Funkcja RDMA jest włączona tylko za pośrednictwem sieci InfiniBand (IB) i jest obsługiwana dla wszystkich maszyn wirtualnych z obsługą funkcji RDMA. Protokół IP przez IB jest obsługiwany tylko na maszyny wirtualne z włączoną obsługą funkcji SR-IOV. Funkcja RDMA nie jest włączona za pośrednictwem sieci Ethernet.

  • System operacyjny — dystrybucje systemu Linux, takie jak CentOS, RHEL, Ubuntu i SUSE, są często używane. Windows Server 2016 i nowsze wersje są obsługiwane na wszystkich maszyn wirtualnych serii HPC. Windows Server 2012 R2 i Windows Server 2012 są również obsługiwane na maszyny wirtualne bez obsługi funkcji SR-IOV. Należy pamiętać, Windows Server 2012 R2 nie jest obsługiwany w przypadku maszyn wirtualnych HBv2 lub większych niż 64 rdzenie (wirtualne lub fizyczne). Zobacz Obrazy maszyn wirtualnych, aby uzyskać listę obsługiwanych obrazów maszyn wirtualnych w witrynie Marketplace oraz sposób ich odpowiedniego konfigurowania. Na odpowiednich stronach rozmiarów maszyn wirtualnych znajduje się również lista obsługi stosu oprogramowania.

  • InfiniBand i sterowniki — w przypadku maszyn wirtualnych z włączoną obsługą infiniBand do włączenia funkcji RDMA są wymagane odpowiednie sterowniki. Zobacz Obrazy maszyn wirtualnych, aby uzyskać listę obsługiwanych obrazów maszyn wirtualnych w witrynie Marketplace oraz sposób ich odpowiedniego konfigurowania. Zobacz też włączanie infiniBand , aby dowiedzieć się więcej o rozszerzeniach maszyn wirtualnych lub ręcznej instalacji sterowników InfiniBand.

  • MPI — rozmiary maszyn wirtualnych z włączoną obsługą funkcji SR-IOV na platformie Azure umożliwiają korzystanie z niemal wszystkich odmian MPI z mellanox OFED. Na maszynach wirtualnych bez obsługi funkcji SR-IOV obsługiwane implementacje MPI używają interfejsu ND (Microsoft Network Direct) do komunikacji między maszynami wirtualnych. W związku z tym obsługiwane są tylko wersje Intel MPI 5.x i Microsoft MPI (MS-MPI) 2012 R2 lub nowsze. Nowsze wersje biblioteki środowiska uruchomieniowego Intel MPI mogą być lub nie być zgodne ze sterownikami RDMA platformy Azure. Zobacz Setup MPI for HPC (Konfigurowanie mpI dla hpc ), aby uzyskać więcej informacji na temat konfigurowania mpi na komputerach wirtualnych HPC na platformie Azure.

    Uwaga

    Przestrzeń adresowa sieci RDMA: sieć RDMA na platformie Azure rezerwuje przestrzeń adresową 172.16.0.0/16. Aby uruchamiać aplikacje MPI na wystąpieniach wdrożonych w sieci wirtualnej platformy Azure, upewnij się, że przestrzeń adresowa sieci wirtualnej nie nakłada się na sieć RDMA.

Opcje konfiguracji klastra

Platforma Azure oferuje kilka opcji tworzenia klastrów maszyn wirtualnych HPC, które mogą komunikować się za pomocą sieci RDMA, w tym:

  • Maszyny wirtualne — wdrażaj maszyny wirtualne HPC z możliwością RDMA w tym samym zestawie skalowania lub zestawie dostępności (w przypadku używania Azure Resource Manager modelu wdrażania). Jeśli używasz klasycznego modelu wdrażania, wd wdrażaj maszyny wirtualne w tej samej usłudze w chmurze.

  • Zestawy skalowania maszyn wirtualnych — w zestawie skalowania maszyn wirtualnych należy ograniczyć wdrożenie do pojedynczej grupy umieszczania dla komunikacji InfiniBand w zestawie skalowania. Na przykład w szablonie Resource Manager ustaw właściwość singlePlacementGroup na wartość true. Należy pamiętać, że maksymalny rozmiar zestawu skalowania singlePlacementGroup=true , który można użyć, jest domyślnie ograniczony do 100 maszyn wirtualnych. Jeśli potrzeby skalowania zadań HPC są wyższe niż 100 maszyn wirtualnych w jednej dzierżawie, możesz zażądać zwiększenia, otworzyć żądanie obsługi klienta online bez opłat. Limit liczby maszyn wirtualnych w jednym zestawie skalowania można zwiększyć do 300. Należy pamiętać, że w przypadku wdrażania maszyn wirtualnych przy użyciu zestawów dostępności maksymalny limit wynosi 200 maszyn wirtualnych na zestaw dostępności.

    Uwaga

    MpI między maszynami wirtualnymi: jeśli między maszynami wirtualnymi (maszynami wirtualnymi) jest wymagana komunikacja RDMA (np. przy użyciu komunikacji MPI), upewnij się, że maszyny wirtualne znajdują się w tym samym zestawie skalowania maszyn wirtualnych lub zestawie dostępności.

  • Azure CycleCloud — tworzenie klastra HPC przy użyciu Azure CycleCloud do uruchamiania zadań MPI.

  • Azure Batch — utwórz pulę Azure Batch do uruchamiania obciążeń MPI. Aby używać wystąpień intensywnie obciążanych obliczeniami podczas uruchamiania aplikacji MPI w programie Azure Batch, zobacz Use multi-instance tasks to run Message Passing Interface (MPI) applications in Azure Batch (Używanie zadań o wielu wystąpieniach do uruchamiania aplikacji Message Passing Interface (MPI) w programie Azure Batch.

  • Microsoft HPC Pack - Pakiet HPC Pack zawiera środowisko uruchomieniowe dla ms-MPI, które używa sieci RdMA platformy Azure w przypadku wdrożenia na maszyny wirtualne z systemem Linux z możliwością RDMA. Przykładowe wdrożenia można znaleźć w temacie Set up a Linux RDMA cluster with HPC Pack to run MPI applications (Konfigurowanie klastra RDMA systemu Linux przy użyciu pakietu HPC Pack w celu uruchamiania aplikacji MPI).

Zagadnienia dotyczące wdrażania

  • Subskrypcja platformy Azure — aby wdrożyć więcej niż kilka wystąpień intensywnie obciążanych obliczeniami, należy wziąć pod uwagę subskrypcję z płatnością zgodnie z ty lub inne opcje zakupu. Jeśli używasz bezpłatnego konta platformy Azure, możesz użyć ograniczonej liczby rdzeni obliczeniowych platformy Azure.

  • Ceny i dostępność — sprawdź ceny i dostępność maszyn wirtualnychwedług regionów świadczenia usługi Azure.

  • Limit przydziału rdzeni — może być konieczne zwiększenie limitu przydziału rdzeni w subskrypcji platformy Azure z wartości domyślnej. Subskrypcja może również ograniczyć liczbę rdzeni, które można wdrożyć w niektórych rodzinach rozmiarów maszyn wirtualnych, w tym w serii H. Aby zażądać zwiększenia limitu przydziału, otwórz bezpłatnie wniosek o pomoc techniczną online. (Limity domyślne mogą się różnić w zależności od kategorii subskrypcji).

    Uwaga

    Skontaktuj pomoc techniczna platformy Azure, jeśli potrzebujesz pojemności na dużą skalę. Limity przydziału platformy Azure to limity środków, a nie gwarancje pojemności. Niezależnie od limitu przydziału opłaty są naliczane tylko za rdzenie, których używasz.

  • Sieć wirtualna — sieć wirtualna platformy Azure nie jest wymagana do korzystania z wystąpień intensywnie obciążanych obliczeniami. Jednak w przypadku wielu wdrożeń potrzebujesz co najmniej sieci wirtualnej platformy Azure opartej na chmurze lub połączenia typu lokacja-lokacja, jeśli chcesz uzyskać dostęp do zasobów lokalnych. W razie potrzeby utwórz nową sieć wirtualną w celu wdrożenia wystąpień. Dodawanie maszyn wirtualnych intensywnie obciążanych obliczeniami do sieci wirtualnej w grupie koligacji nie jest obsługiwane.

  • Zmiana rozmiaru — dzięki wyspecjalizowanemu sprzętowi można zmieniać rozmiar wystąpień intensywnie obciążających obliczenia tylko w ramach tej samej rodziny rozmiarów (serii H lub N). Na przykład można zmienić rozmiar maszyny wirtualnej serii H tylko z jednego rozmiaru serii H na inny. W przypadku niektórych maszyn wirtualnych mogą być rozważane dodatkowe zagadnienia dotyczące obsługi sterowników InfiniBand i dysków NVMe.

Inne rozmiary

Następne kroki