Wymiary maszyn wirtualnych o wysokiej wydajności obliczeniowejHigh performance compute virtual machine sizes

Zoptymalizowane maszyny wirtualne platformy Azure HPC są przeznaczone do zapewniania wydajności klasy lidera, skalowalności MPI i opłacalności dla różnych aplikacji w świecie rzeczywistym.Azure HPC optimized virtual machines (VMs) are designed to deliver leadership-class performance, MPI scalability, and cost efficiency for a variety of real-world applications.

Sieci InfiniBand dla dużej skali HPCInfiniBand Networking for Large Scale HPC

Funkcja maszyn wirtualnych HBv2 200 GB/s — karta Mellanox HDR InfiniBand, podczas gdy maszyna wirtualna o wartości HB i HC z funkcją 100 GB/s Mellanox EDR InfiniBand.HBv2 VMs feature 200 Gb/sec Mellanox HDR InfiniBand, while both HB and HC VMs feature 100 Gb/sec Mellanox EDR InfiniBand. Każdy z tych typów maszyn wirtualnych jest podłączony do nieblokującego drzewa FAT w celu zoptymalizowanej i spójnej wydajności RDMA.Each of these VM types are connected in a non-blocking fat tree for optimized and consistent RDMA performance.

Maszyny wirtualne HBv2 obsługują Routing adaptacyjny oraz transport podłączony dynamicznie (DCT) w dodatkowych standardach do standardowych wersji RC i UD Transports.HBv2 VMs support Adaptive Routing and the Dynamic Connected Transport (DCT, in additional to standard RC and UD transports). Te funkcje rozszerzają wydajność, skalowalność i spójność aplikacji, a ich użycie jest zdecydowanie zalecane.These features enhance application performance, scalability, and consistency, and usage of them is strongly recommended.

Maszyny wirtualne HBv2, HB i HC obsługują standardowe sterowniki Mellanox/OFED.HBv2, HB, and HC VMs support standard Mellanox/OFED drivers. W związku z tym obsługiwane są wszystkie czasowniki RDMA i typy MPI.As such, all RDMA verbs and MPI types are supported. Każdy z tych typów maszyn wirtualnych obsługuje również sprzętowe odciążanie MPI zbiory w celu zwiększenia wydajności aplikacji.Each of these VM types also support hardware-based offload of MPI collectives for increased application performance.

Oryginalne maszyny wirtualne serii H — funkcja 56 GB/s, karta Mellanox FDR InfiniBand.Original H-series VMs feature 56 Gb/sec Mellanox FDR InfiniBand. Aby korzystać z interfejsu InfiniBand w serii H, klienci muszą wdrażać przy użyciu oficjalnie obsługiwanych obrazów określonych dla tego typu maszyn wirtualnych w portalu Azure Marketplace.To leverage the InfiniBand interface on H-series, customers must deploy using officially supported images specific to this VM type from the Azure Marketplace.

Seria HBv2HBv2-series

Maszyny wirtualne z serii HBv2 są zoptymalizowane pod kątem aplikacji opartych na przepustowości pamięci, takich jak dynamika płynów, skończone analizy elementów i symulacja zbiornika.HBv2-series VMs are optimized for applications driven by memory bandwidth, such as fluid dynamics, finite element analysis, and reservoir simulation. HBv2 maszyny wirtualne z funkcją 120 AMD EPYC 7742 rdzeni procesora, 4 GB pamięci RAM na rdzeń procesora CPU i bez jednoczesnego wielowątkowości.HBv2 VMs feature 120 AMD EPYC 7742 processor cores, 4 GB of RAM per CPU core, and no simultaneous multithreading. Każda maszyna wirtualna w HBv2 zapewnia do 340 GB/s przepustowości pamięci oraz do 4 teraflopa obliczeń FP64.Each HBv2 VM provides up to 340 GB/sec of memory bandwidth, and up to 4 teraFLOPS of FP64 compute.

Premium Storage: obsługiwanePremium Storage: Supported

RozmiarSize vCPUvCPU ProcesorProcessor Pamięć (GB)Memory (GB) Przepustowość pamięci GB/sMemory bandwidth GB/s Podstawowa częstotliwość procesora CPU (GHz)Base CPU frequency (GHz) Częstotliwość wszystkich rdzeni (GHz, szczyt)All-cores frequency (GHz, peak) Częstotliwość jednordzeniowa (GHz, szczytowa)Single-core frequency (GHz, peak) Wydajność RDMA (GB/s)RDMA performance (Gb/s) Obsługa MPIMPI support Magazyn tymczasowy (GB)Temp storage (GB) Maksymalna liczba dysków danychMax data disks Maksymalna liczba kart sieciowych EthernetMax Ethernet NICs
Standard_HB120rsStandard_HB120rs 120120 PROCESOR AMD EPYC 7742AMD EPYC 7742 480480 350350 2.452.45 2.452.45 3.43.4 200200 WszystkoAll 480 + 960480 + 960 88 11

Seria HBHB-series

Maszyny wirtualne z serii HB są zoptymalizowane pod kątem zastosowań zależnych od przepustowości pamięci, takich jak dynamika płynów, jawna analiza elementów skończonych i modelowanie pogody.HB-series VMs are optimized for applications driven by memory bandwidth, such as fluid dynamics, explicit finite element analysis, and weather modeling. HB VM funkcja 60 AMD EPYC 7551 rdzeni procesora, 4 GB pamięci RAM na rdzeń procesora CPU i bez jednoczesnego wielowątkowości.HB VMs feature 60 AMD EPYC 7551 processor cores, 4 GB of RAM per CPU core, and no simultaneous multithreading. Maszyna wirtualna HB oferuje do 260 GB/s przepustowości pamięci.An HB VM provides up to 260 GB/sec of memory bandwidth.

ACU: 199-216ACU: 199-216

Premium Storage: obsługiwanePremium Storage: Supported

Buforowanie Premium Storage: obsługiwanePremium Storage Caching: Supported

RozmiarSize vCPUvCPU ProcesorProcessor Pamięć (GiB)Memory (GiB) GiB przepustowości pamięciMemory bandwidth GiB/s Podstawowa częstotliwość procesora CPU (GHz)Base CPU frequency (GHz) Częstotliwość wszystkich rdzeni (GHz, szczyt)All-cores frequency (GHz, peak) Częstotliwość jednordzeniowa (GHz, szczytowa)Single-core frequency (GHz, peak) Wydajność RDMA (GiB/s)RDMA performance (GiB/s) Obsługa MPIMPI support Magazyn tymczasowy (GiB)Temp storage (GiB) Maksymalna liczba dysków danychMax data disks Maksymalna liczba kart sieciowych EthernetMax Ethernet NICs
Standard_HB60rsStandard_HB60rs 6060 AMD EPYC 7551AMD EPYC 7551 240240 263263 2.02.0 2.552.55 2.552.55 100100 WszystkoAll 700700 44 11

Seria HCHC-series

Maszyny wirtualne z serii HC są zoptymalizowane pod kątem aplikacji opartych na gęstym obliczaniu, takich jak niejawne ograniczone analizy elementów, biocząsteczkowa i obliczeniowa.HC-series VMs are optimized for applications driven by dense computation, such as implicit finite element analysis, molecular dynamics, and computational chemistry. Maszyny wirtualne HC dysponują 44 rdzeniami procesorów Intel Xeon Platinum 8168, 8 GB pamięci RAM na rdzeń procesora CPU i nie korzystają z hiperwątkowości.HC VMs feature 44 Intel Xeon Platinum 8168 processor cores, 8 GB of RAM per CPU core, and no hyperthreading. Platforma Intel Xeon Platinum obsługuje bogate ekosystemy narzędzi programistycznych firmy Intel, takich jak biblioteka jądra matematyczna firmy Intel.The Intel Xeon Platinum platform supports Intel’s rich ecosystem of software tools such as Intel Math Kernel Library.

ACU: 297-315ACU: 297-315

Premium Storage: obsługiwanePremium Storage: Supported

Buforowanie Premium Storage: obsługiwanePremium Storage Caching: Supported

RozmiarSize vCPUvCPU ProcesorProcessor Pamięć (GiB)Memory (GiB) GiB przepustowości pamięciMemory bandwidth GiB/s Podstawowa częstotliwość procesora CPU (GHz)Base CPU frequency (GHz) Częstotliwość wszystkich rdzeni (GHz, szczyt)All-cores frequency (GHz, peak) Częstotliwość jednordzeniowa (GHz, szczytowa)Single-core frequency (GHz, peak) Wydajność RDMA (GiB/s)RDMA performance (GiB/s) Obsługa MPIMPI support Magazyn tymczasowy (GiB)Temp storage (GiB) Maksymalna liczba dysków danychMax data disks Maksymalna liczba kart sieciowych EthernetMax Ethernet NICs
Standard_HC44rsStandard_HC44rs 4444 Intel Xeon Platinum 8168Intel Xeon Platinum 8168 352352 191191 2.72.7 3.43.4 3.73.7 100100 WszystkoAll 700700 44 11

Seria HH-series

Maszyny wirtualne z serii H są zoptymalizowane pod kątem aplikacji z wysoką częstotliwością procesora CPU lub dużą ilością pamięci na podstawowe wymagania.H-series VMs are optimized for applications driven by high CPU frequencies or large memory per core requirements. Maszyny wirtualne serii H funkcja 8 lub 16 rdzeni procesora Intel Xeon E5 2667 v3, do 14 GB pamięci RAM na rdzeń procesora CPU i bez wielowątkowości.H-series VMs feature 8 or 16 Intel Xeon E5 2667 v3 processor cores, up to 14 GB of RAM per CPU core, and no hyperthreading. Maszyna wirtualna serii H zapewnia do 80 GB/s przepustowości pamięci.An H-series VM provides up to provides up to 80 GB/sec of memory bandwidth.

ACU: 290–300ACU: 290-300

Premium Storage: nieobsługiwanePremium Storage: Not Supported

Buforowanie Premium Storage: nieobsługiwanePremium Storage Caching: Not Supported

RozmiarSize vCPUvCPU ProcesorProcessor Pamięć (GiB)Memory (GiB) GiB przepustowości pamięciMemory bandwidth GiB/s Podstawowa częstotliwość procesora CPU (GHz)Base CPU frequency (GHz) Częstotliwość wszystkich rdzeni (GHz, szczyt)All-cores frequency (GHz, peak) Częstotliwość jednordzeniowa (GHz, szczytowa)Single-core frequency (GHz, peak) Wydajność RDMA (GiB/s)RDMA performance (GiB/s) Obsługa MPIMPI support Magazyn tymczasowy (GiB)Temp storage (GiB) Maksymalna liczba dysków danychMax data disks Maksymalna liczba kart sieciowych EthernetMax Ethernet NICs
Standardowa_H8Standard_H8 88 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 5656 4040 3,23.2 3.33.3 3.63.6 - Intel 5.x, MS-MPIIntel 5.x, MS-MPI 10001000 3232 22
Standardowa_H16Standard_H16 1616 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 112112 8080 3,23.2 3.33.3 3.63.6 - Intel 5.x, MS-MPIIntel 5.x, MS-MPI 20002000 6464 44
Standardowa_H8mStandard_H8m 88 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 112112 4040 3,23.2 3.33.3 3.63.6 - Intel 5.x, MS-MPIIntel 5.x, MS-MPI 10001000 3232 22
Standardowa_H16mStandard_H16m 1616 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 224224 8080 3,23.2 3.33.3 3.63.6 - Intel 5.x, MS-MPIIntel 5.x, MS-MPI 20002000 6464 44
Standard_H16r 1Standard_H16r 1 1616 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 112112 8080 3,23.2 3.33.3 3.63.6 5656 Intel 5.x, MS-MPIIntel 5.x, MS-MPI 20002000 6464 44
Standard_H16mr 1Standard_H16mr 1 1616 Intel Xeon E5 2667 v3Intel Xeon E5 2667 v3 224224 8080 3,23.2 3.33.3 3.63.6 5656 Intel 5.x, MS-MPIIntel 5.x, MS-MPI 20002000 6464 44

1 w przypadku aplikacji MPI dedykowana sieć zaplecza RDMA jest włączona przez sieć FDR InfiniBand.1 For MPI applications, dedicated RDMA backend network is enabled by FDR InfiniBand network.


Definicje tabel rozmiaruSize table definitions

  • Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów).Storage capacity is shown in units of GiB or 1024^3 bytes. W przypadku porównywania dysków mierzonych w GB (1000 ^ 3 bajtów) z dyskami mierzonymi w GiB (1024 ^ 3) Pamiętaj, że numery pojemności określone w GiB mogą być mniejsze.When you compare disks measured in GB (1000^3 bytes) to disks measured in GiB (1024^3) remember that capacity numbers given in GiB may appear smaller. Na przykład 1023 GiB = 1098,4 GB.For example, 1023 GiB = 1098.4 GB.

  • Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.Disk throughput is measured in input/output operations per second (IOPS) and MBps where MBps = 10^6 bytes/sec.

  • Dyski danych mogą działać w trybie buforowanym lub niebuforowanym.Data disks can operate in cached or uncached modes. Dla pracy dysku danych w trybie buforowanym tryb pamięci podręcznej hosta jest ustawiony na wartość ReadOnly lub ReadWrite.For cached data disk operation, the host cache mode is set to ReadOnly or ReadWrite. Dla pracy dysku danych bez buforowania tryb pamięci podręcznej hosta jest ustawiony na wartość None.For uncached data disk operation, the host cache mode is set to None.

  • Jeśli chcesz uzyskać najlepszą wydajność dla maszyn wirtualnych, należy ograniczyć liczbę dysków danych do dwóch dysków na vCPU.If you want to get the best performance for your VMs, you should limit the number of data disks to two disks per vCPU.

  • Oczekiwana przepustowość sieci to maksymalna zagregowana przepustowość przyalokowana na typ maszyny wirtualnej dla wszystkich kart sieciowych dla wszystkich miejsc docelowych.Expected network bandwidth is the maximum aggregated bandwidth allocated per VM type across all NICs, for all destinations. Aby uzyskać więcej informacji, zobacz przepustowość sieci maszyny wirtualnej.For more information, see Virtual machine network bandwidth.

    Górne limity nie są gwarantowane.Upper limits aren't guaranteed. Ogranicza wskazówki dotyczące wybierania odpowiedniego typu maszyny wirtualnej dla zamierzonej aplikacji.Limits offer guidance for selecting the right VM type for the intended application. Rzeczywista wydajność sieci będzie zależeć od kilku czynników, w tym przeciążenia sieci, obciążeń aplikacji i ustawień sieciowych.Actual network performance will depend on several factors including network congestion, application loads, and network settings. Aby uzyskać informacje na temat optymalizowania przepływności sieci, zobacz Optymalizowanie przepływności sieci dla maszyn wirtualnych platformy Azure.For information on optimizing network throughput, see Optimize network throughput for Azure virtual machines. Aby osiągnąć oczekiwaną wydajność sieci w systemie Linux lub Windows, może być konieczne wybranie określonej wersji lub jej zoptymalizowanie.To achieve the expected network performance on Linux or Windows, you may need to select a specific version or optimize your VM. Aby uzyskać więcej informacji, zobacz testowanie przepustowości/przepływności (NTTTCP).For more information, see Bandwidth/Throughput testing (NTTTCP).

Zagadnienia dotyczące wdrażaniaDeployment considerations

  • Subskrypcja platformy Azure — aby wdrożyć więcej niż kilka wystąpień intensywnie korzystających z obliczeń, weź pod uwagę subskrypcję z płatność zgodnie z rzeczywistym użyciem lub inne opcje zakupu.Azure subscription – To deploy more than a few compute-intensive instances, consider a pay-as-you-go subscription or other purchase options. Jeśli używasz bezpłatnego konta platformy Azure, możesz użyć ograniczonej liczby rdzeni obliczeniowych platformy Azure.If you're using an Azure free account, you can use only a limited number of Azure compute cores.

  • Cennik i dostępność — te rozmiary maszyn wirtualnych są oferowane tylko w warstwie cenowej standardowa.Pricing and availability - These VM sizes are offered only in the Standard pricing tier. Sprawdź dostępność produktów według regionów w regionach świadczenia usługi Azure.Check Products available by region for availability in Azure regions.

  • Przydział rdzeni — może być konieczne zwiększenie limitu przydziału rdzeni w ramach subskrypcji platformy Azure z wartości domyślnej.Cores quota – You might need to increase the cores quota in your Azure subscription from the default value. Twoja subskrypcja może również ograniczyć liczbę rdzeni, które można wdrożyć w niektórych rodzinach rozmiarów maszyn wirtualnych, w tym dla serii H.Your subscription might also limit the number of cores you can deploy in certain VM size families, including the H-series. Aby zażądać zwiększenia limitu przydziału, Otwórz bezpłatnie żądanie pomocy technicznej w trybie online .To request a quota increase, open an online customer support request at no charge. (Domyślne limity mogą się różnić w zależności od kategorii subskrypcji).(Default limits may vary depending on your subscription category.)

    Uwaga

    Skontaktuj się z pomocą techniczną platformy Azure, jeśli potrzebujesz dużej pojemności.Contact Azure Support if you have large-scale capacity needs. Przydziały platformy Azure to limity kredytowe, a nie gwarancje wydajności.Azure quotas are credit limits, not capacity guarantees. Niezależnie od limitu przydziału opłata jest naliczana tylko za używane rdzenie.Regardless of your quota, you are only charged for cores that you use.

  • Sieć wirtualnaSieć wirtualna platformy Azure nie jest wymagana do korzystania z wystąpień intensywnie korzystających z obliczeń.Virtual network – An Azure virtual network is not required to use the compute-intensive instances. Jednak w przypadku wielu wdrożeń potrzebna jest co najmniej oparta na chmurze usługa Azure Virtual Network lub połączenie lokacja-lokacja, jeśli trzeba uzyskać dostęp do zasobów lokalnych.However, for many deployments you need at least a cloud-based Azure virtual network, or a site-to-site connection if you need to access on-premises resources. W razie potrzeby utwórz nową sieć wirtualną, aby wdrożyć wystąpienia.When needed, create a new virtual network to deploy the instances. Dodawanie maszyn wirtualnych intensywnie korzystających z obliczeń do sieci wirtualnej w grupie koligacji nie jest obsługiwane.Adding compute-intensive VMs to a virtual network in an affinity group is not supported.

  • Zmiana rozmiaru — ze względu na ich wyspecjalizowany sprzęt można zmienić tylko wystąpienia intensywnie korzystające z obliczeń w obrębie tej samej rodziny (serii H lub serii A).Resizing – Because of their specialized hardware, you can only resize compute-intensive instances within the same size family (H-series or compute-intensive A-series). Na przykład można zmienić rozmiar maszyny wirtualnej serii H tylko z jednego rozmiaru serii H na inny.For example, you can only resize an H-series VM from one H-series size to another. Ponadto nie jest obsługiwane Zmienianie rozmiaru z intensywnie korzystającej z wielkości obliczeniowej na rozmiar intensywnie korzystający z obliczeń.In addition, resizing from a non-compute-intensive size to a compute-intensive size is not supported.

Wystąpienia z obsługą technologii RDMARDMA-capable instances

Podzestaw wystąpień intensywnie korzystających z obliczeń (A8, A9, H16r, H16mr, HB i HC) ma interfejs sieciowy do łączności z funkcją zdalnego bezpośredniego dostępu do pamięci (RDMA).A subset of the compute-intensive instances (A8, A9, H16r, H16mr, HB and HC) feature a network interface for remote direct memory access (RDMA) connectivity. Wybrane rozmiary serii N oznaczone przy użyciu opcji "r", takie jak konfiguracje NC24rs (NC24rs_v2 i NC24rs_v3), również obsługują funkcję RDMA.Selected N-series sizes designated with 'r' such as the NC24rs configurations (NC24rs_v2 and NC24rs_v3) are also RDMA-capable. Ten interfejs jest poza standardowym interfejsem sieciowym platformy Azure dostępnym dla innych rozmiarów maszyn wirtualnych.This interface is in addition to the standard Azure network interface available to other VM sizes.

Ten interfejs umożliwia wystąpienia z obsługą funkcji RDMA, które komunikują się za pośrednictwem sieci InfiniBand (IB), działającą w stawkach EDR w przypadku HB, HC, FDR stawek dla maszyn wirtualnych z serii N, H16mr i RDMA i częstotliwości QDR dla maszyn wirtualnych A8 i A9.This interface allows the RDMA-capable instances to communicate over an InfiniBand (IB) network, operating at EDR rates for HB, HC, FDR rates for H16r, H16mr, and RDMA-capable N-series virtual machines, and QDR rates for A8 and A9 virtual machines. Te możliwości RDMA umożliwiają zwiększenie skalowalności i wydajności niektórych aplikacji MPI (Message Passing Interface).These RDMA capabilities can boost the scalability and performance of certain Message Passing Interface (MPI) applications. Aby uzyskać więcej informacji na temat szybkości, zobacz szczegóły w tabelach na tej stronie.For more information on speed, see the details in the tables on this page.

Uwaga

Na platformie Azure funkcja IP over IB jest obsługiwana tylko na maszynach wirtualnych z obsługą wirtualizacji SR-IOV (SR-IOV dla InfiniBand, obecnie HB i HC).In Azure, IP over IB is only supported on the SR-IOV enabled VMs (SR-IOV for InfiniBand, currently HB and HC). Funkcja RDMA przez IB jest obsługiwana dla wszystkich wystąpień z obsługą funkcji RDMA.RDMA over IB is supported for all RDMA-capable instances.

MPIMPI

Rozmiary maszyn wirtualnych z obsługą wirtualizacji SR-IOV na platformie Azure zezwalają na użycie niemal wszystkich wersji MPI.The SR-IOV enabled VM sizes on Azure allow almost any flavor of MPI to be used. Na maszynach wirtualnych z obsługą wirtualizacji SR-IOV obsługiwane są tylko wersje Intel MPI 5. x.On non-SR-IOV enabled VMs, only Intel MPI 5.x versions are supported. Nowsze wersje (2017, 2018) biblioteki środowiska uruchomieniowego Intel MPI mogą być niezgodne ze sterownikami RDMA systemu Linux.Later versions (2017, 2018) of the Intel MPI runtime library may or may not be compatible with the Azure Linux RDMA drivers.

Obsługiwane obrazy systemu operacyjnegoSupported OS images

Portal Azure Marketplace ma wiele dystrybucji systemu Linux obsługujących łączność RDMA:The Azure Marketplace has many Linux distributions that support RDMA connectivity:

  • CentOS HPC — dla maszyn wirtualnych z obsługą wirtualizacji SR-IOV, CentOS w wersji 6,5 HPC lub nowszej, do 7,5 są odpowiednie.CentOS-based HPC - For non-SR-IOV enabled VMs, CentOS-based version 6.5 HPC or a later version, up to 7.5 are suitable. W przypadku maszyn wirtualnych z serii H zaleca się używanie wersji 7,1 do 7,5.For H-series VMs, versions 7.1 to 7.5 are recommended. Sterowniki RDMA i Intel MPI 5,1 są zainstalowane na maszynie wirtualnej.RDMA drivers and Intel MPI 5.1 are installed on the VM. W przypadku maszyn wirtualnych SR-IOV CentOS-HPC 7,6 jest zoptymalizowane i wstępnie załadowane ze sterownikami RDMA i zainstalowanymi różnymi pakietami MPI.For SR-IOV VMs, CentOS-HPC 7.6 comes optimized and pre-loaded with the RDMA drivers and various MPI packages installed. W przypadku innych obrazów maszyn wirtualnych RHEL/CentOS Dodaj rozszerzenie InfiniBandLinux, aby włączyć funkcję InfiniBand.For other RHEL/CentOS VM images, add the InfiniBandLinux extension to enable InfiniBand. To rozszerzenie maszyny wirtualnej z systemem Linux instaluje sterowniki Mellanox OFED (na maszynach wirtualnych SR-IOV) na potrzeby łączności RDMA.This Linux VM extension installs Mellanox OFED drivers (on SR-IOV VMs) for RDMA connectivity. Następujące polecenie cmdlet programu PowerShell instaluje najnowszą wersję (w wersji 1,0) rozszerzenia InfiniBandDriverLinux na istniejącej maszynie wirtualnej z obsługą funkcji RDMA.The following PowerShell cmdlet installs the latest version (version 1.0) of the InfiniBandDriverLinux extension on an existing RDMA-capable VM. Maszyna wirtualna z obsługą funkcji RDMA ma nazwę myVM i jest wdrażana w grupie zasobów o nazwie Moja zasobów w regionie zachodnie stany USA w następujący sposób:The RDMA-capable VM is named myVM and is deployed in the resource group named myResourceGroup in the West US region as follows:

    Set-AzVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "InfiniBandDriverLinux" -Publisher "Microsoft.HpcCompute" -Type "InfiniBandDriverLinux" -TypeHandlerVersion "1.0"
    

    Alternatywnie rozszerzenia maszyn wirtualnych można dołączać do szablonów Azure Resource Manager, aby ułatwić wdrażanie za pomocą następującego elementu JSON:Alternatively, VM extensions can be included in Azure Resource Manager templates for easy deployment with the following JSON element:

    "properties":{
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.0",
    } 
    

    Następujące polecenie instaluje najnowszą wersję 1,0 rozszerzenia InfiniBandDriverLinux na wszystkich maszynach wirtualnych z obsługą funkcji RDMA w istniejącym zestawie skalowania maszyn wirtualnych o nazwie myVMSS wdrożoną w grupie zasobów o nazwie Moja zasobów:The following command installs the latest version 1.0 InfiniBandDriverLinux extension on all RDMA-capable VMs in an existing VM scale set named myVMSS deployed in the resource group named myResourceGroup:

    $VMSS = Get-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS"
    Add-AzVmssExtension -VirtualMachineScaleSet $VMSS -Name "InfiniBandDriverLinux" -Publisher "Microsoft.HpcCompute" -Type "InfiniBandDriverLinux" -TypeHandlerVersion "1.0"
    Update-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "MyVMSS" -VirtualMachineScaleSet $VMSS
    Update-AzVmssInstance -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS" -InstanceId "*"
    

    Uwaga

    W obrazach HPC opartych na CentOS aktualizacje jądra są wyłączone w pliku konfiguracyjnym yum .On the CentOS-based HPC images, kernel updates are disabled in the yum configuration file. Wynika to z faktu, że sterowniki RDMA systemu Linux są dystrybuowane jako pakiet RPM, a aktualizacje sterowników mogą nie zadziałać, jeśli jądro zostało zaktualizowane.This is because Linux RDMA drivers are distributed as an RPM package, and driver updates might not work if the kernel is updated.

  • SUSE Linux Enterprise Server -SLES 12 SP3 dla HPC, SLES 12 SP3 dla HPC (Premium), SLES 12 SP1 dla HPC, SLES 12 SP1 dla HPC (Premium), SLES 12 SP4 i SLES 15.SUSE Linux Enterprise Server - SLES 12 SP3 for HPC, SLES 12 SP3 for HPC (Premium), SLES 12 SP1 for HPC, SLES 12 SP1 for HPC (Premium), SLES 12 SP4 and SLES 15. Sterowniki RDMA są zainstalowane i pakiety Intel MPI są dystrybuowane na maszynie wirtualnej.RDMA drivers are installed and Intel MPI packages are distributed on the VM. Zainstaluj program MPI, uruchamiając następujące polecenie:Install MPI by running the following command:

    sudo rpm -v -i --nodeps /opt/intelMPI/intel_mpi_packages/*.rpm
    
  • Ubuntu -Ubuntu Server 16,04 LTS, 18,04 LTS.Ubuntu - Ubuntu Server 16.04 LTS, 18.04 LTS. Skonfiguruj sterowniki RDMA na maszynie wirtualnej i zarejestruj się w firmie Intel, aby pobrać firmę Intel MPI:Configure RDMA drivers on the VM and register with Intel to download Intel MPI:

    1. Zainstaluj dapl, rdmacm, ibverbs i mlx4Install dapl, rdmacm, ibverbs, and mlx4

      sudo apt-get update
      
      sudo apt-get install libdapl2 libmlx4-1
      
      
    2. W ścieżce/etc/waagent.conf należy włączyć funkcję RDMA, uncommenting następujące wiersze konfiguracji.In /etc/waagent.conf, enable RDMA by uncommenting the following configuration lines. Potrzebny jest dostęp głównego, aby edytować ten plik.You need root access to edit this file.

      OS.EnableRDMA=y
      
      OS.UpdateRdmaDriver=y
      
    3. Dodaj lub Zmień następujące ustawienia pamięci w KB w pliku /etc/security/limits.conf.Add or change the following memory settings in KB in the /etc/security/limits.conf file. Potrzebny jest dostęp głównego, aby edytować ten plik.You need root access to edit this file. Do celów testowych można ustawić memlock bez ograniczeń.For testing purposes you can set memlock to unlimited. Na przykład: <User or group name> hard memlock unlimited.For example: <User or group name> hard memlock unlimited.

      <User or group name> hard    memlock <memory required for your application in KB>
      
      <User or group name> soft    memlock <memory required for your application in KB>
      
    4. Zainstaluj Intel MPI biblioteki.Install Intel MPI Library. Albo kupić i pobrać biblioteki Intel lub pobierania wersję bezpłatną wersją ewaluacyjną.Either purchase and download the library from Intel or download the free evaluation version.

      wget http://registrationcenter-download.intel.com/akdlm/irc_nas/tec/9278/l_mpi_p_5.1.3.223.tgz
      

      Obsługiwane są tylko runtimes 5.x Intel MPI.Only Intel MPI 5.x runtimes are supported.

      Aby uzyskać instrukcje instalacji, zobacz Intel MPI biblioteki Installation Guide.For installation steps, see the Intel MPI Library Installation Guide.

    5. Włącz ptrace dla użytkowników innych niż root debugger innych procesów (wymagane dla najnowszej wersji Intel MPI).Enable ptrace for non-root non-debugger processes (needed for the most recent versions of Intel MPI).

      echo 0 | sudo tee /proc/sys/kernel/yama/ptrace_scope
      

    Aby uzyskać więcej informacji na temat włączania funkcji InfiniBand, konfigurowania MPI, zobacz enable InfiniBand.For more details on enabling InfiniBand, setting up MPI, see Enable InfiniBand.

Opcje konfiguracji klastraCluster configuration options

System Azure oferuje kilka opcji tworzenia klastrów maszyn wirtualnych z systemem Linux HPC, które mogą komunikować się za pomocą sieci RDMA, w tym:Azure provides several options to create clusters of Linux HPC VMs that can communicate using the RDMA network, including:

  • Maszyny wirtualne — Wdróż maszyny wirtualne z obsługą funkcji RDMA w tym samym zestawie dostępności (w przypadku korzystania z Azure Resource Manager modelu wdrażania).Virtual machines - Deploy the RDMA-capable HPC VMs in the same availability set (when you use the Azure Resource Manager deployment model). W przypadku korzystania z klasycznego modelu wdrażania należy wdrożyć maszyny wirtualne w tej samej usłudze w chmurze.If you use the classic deployment model, deploy the VMs in the same cloud service.

  • Zestawy skalowania maszyn wirtualnych — w zestawie skalowania maszyn wirtualnych należy ograniczyć wdrożenie do pojedynczej grupy umieszczania.Virtual machine scale sets - In a virtual machine scale set, ensure that you limit the deployment to a single placement group. Na przykład w szablonie Menedżer zasobów ustaw właściwość singlePlacementGroup na true.For example, in a Resource Manager template, set the singlePlacementGroup property to true.

  • MPI między maszynami wirtualnymi — jeśli jest to wymagane między maszynami wirtualnymi, upewnij się, że maszyny wirtualne znajdują się w tym samym zestawie dostępności lub na maszynie wirtualnej tego samego zestawu skalowania.MPI among virtual machines - If MPI communication if required between virtual machines (VMs), ensure that the VMs are in the same availability set or the virtual machine same scale set.

  • Azure CycleCloud — Tworzenie klastra HPC w usłudze Azure CycleCloud w celu uruchamiania zadań MPI w węzłach systemu Linux.Azure CycleCloud - Create an HPC cluster in Azure CycleCloud to run MPI jobs on Linux nodes.

  • Azure Batch — utwórz pulę Azure Batch do uruchamiania obciążeń MPI w węzłach obliczeniowych systemu Linux.Azure Batch - Create an Azure Batch pool to run MPI workloads on Linux compute nodes. Aby uzyskać więcej informacji, zobacz Korzystanie z wystąpień obsługujących funkcję RDMA lub GPU w pulach usługi Batch.For more information, see Use RDMA-capable or GPU-enabled instances in Batch pools. Zobacz również projekt stoczni usługi Batch do uruchamiania obciążeń opartych na kontenerach w usłudze Batch.Also see the Batch Shipyard project, for running container-based workloads on Batch.

  • Pakiet Microsoft HPC pack - HPC Pack obsługuje kilka dystrybucji systemu Linux do uruchomienia w węzłach obliczeniowych wdrożonych na maszynach wirtualnych platformy Azure obsługujących funkcję RDMA zarządzanym przez węzeł główny systemu Windows Server.Microsoft HPC Pack - HPC Pack supports several Linux distributions to run on compute nodes deployed in RDMA-capable Azure VMs, managed by a Windows Server head node. Aby zapoznać się z przykładowym wdrożeniem, zobacz Tworzenie klastra programu HPC Pack w systemie Linux na platformie Azure.For an example deployment, see Create HPC Pack Linux RDMA Cluster in Azure.

Zagadnienia dotyczące sieciNetwork considerations

  • W przypadku maszyn wirtualnych z systemem Linux, które nie obsługują funkcji RDMA na platformie Azure, eth1 jest zarezerwowany dla ruchu sieciowego RDMA.On non-SR-IOV, RDMA-enabled Linux VMs in Azure, eth1 is reserved for RDMA network traffic. Nie należy zmieniać żadnych ustawień eth1 ani żadnych informacji w pliku konfiguracyjnym odnoszących się do tej sieci.Do not change any eth1 settings or any information in the configuration file referring to this network.
  • Na maszynach wirtualnych z obsługą wirtualizacji SR-IOV (HB i HC) ib0 jest zarezerwowany dla ruchu sieciowego RDMA.On SR-IOV enabled VMs (HB and HC-series), ib0 is reserved for RDMA network traffic.
  • Sieć RDMA na platformie Azure rezerwuje przestrzeń adresową 172.16.0.0/16.The RDMA network in Azure reserves the address space 172.16.0.0/16. Aby uruchamiać aplikacje MPI w wystąpieniach wdrożonych w sieci wirtualnej platformy Azure, upewnij się, że przestrzeń adresowa sieci wirtualnej nie nakłada się na sieć RDMA.To run MPI applications on instances deployed in an Azure virtual network, make sure that the virtual network address space does not overlap the RDMA network.
  • W zależności od wybranego narzędzia do zarządzania klastrami może być wymagana dodatkowa konfiguracja systemu do uruchamiania zadań MPI.Depending on your choice of cluster management tool, additional system configuration may be needed to run MPI jobs. Na przykład w klastrze maszyn wirtualnych może być konieczne ustanowienie relacji zaufania między węzłami klastra przez wygenerowanie kluczy SSH lub przez ustanowienie logowania za pomocą protokołu SSH.For example, on a cluster of VMs, you may need to establish trust among the cluster nodes by generating SSH keys or by establishing passwordless SSH logins.

Inne rozmiaryOther sizes

Następne krokiNext steps

  • Dowiedz się więcej na temat sposobu konfigurowania, optymalizowania i skalowania obciążeń HPC na platformie Azure.Learn more about how to setup, optimize and scale HPC workloads on Azure.
  • Dowiedz się więcej o tym, jak usługa Azure COMPUTE units (ACU) może pomóc w porównaniu wydajności obliczeniowej w ramach jednostek SKU platformy Azure.Learn more about how Azure compute units (ACU) can help you compare compute performance across Azure SKUs.