Zaktualizowano serię NDv2

Maszyna wirtualna z serii NDv2 to nowy dodatek do rodziny procesorów GPU zaprojektowany z myślą o potrzebach najbardziej wymagających obciążeń ai, uczenia maszynowego, symulacji i HPC przyspieszanych przez procesory GPU.

NDv2 jest obsługiwany przez 8 procesorów GPU połączonych z nvlinkiem NVIDIA Tesla V100, z których każdy ma 32 GB pamięci procesora GPU. Każda maszyna wirtualna NDv2 ma również 40 niewątkowanych rdzeni Intel Xeon Xp 8168 (Skylake) i 672 GiB pamięci systemowej.

Wystąpienia NDv2 zapewniają doskonałą wydajność dla obciążeń HPC i AI przy użyciu jąder obliczeniowych zoptymalizowanych pod kątem procesora GPU CUDA oraz wielu narzędzi AI, ML i analitycznych, które obsługują przyspieszanie procesora GPU "out-of-box", takich jak TensorFlow, Pytorch, Caffe, RAPIDS i inne.

Co ważne, maszyna NDv2 jest zbudowana zarówno dla obciążeń wymagających intensywnych obliczeniowo skalowania (wykorzystujących 8 procesorów GPU na maszynę wirtualną), jak i obciążeń skalowania w górę (wykorzystując wiele współpracujące ze sobą maszyn wirtualnych). Seria NDv2 obsługuje teraz 100 Gigabit sieci zaplecza InfiniBand EDR, podobnie jak w przypadku maszyn wirtualnych HPC z serii HB, aby umożliwić klastrowanie o wysokiej wydajności dla scenariuszy równoległych, w tym trenowania rozproszonego dla AI i ML. Ta sieć zaplecza obsługuje wszystkie główne protokoły InfiniBand, w tym protokoły używane przez biblioteki NCCL2 firmy NVIDIA, co umożliwia bezproblemowe klastrowanie procesorów GPU.

Ważne

Podczas włączania infiniBand na ND40rs_v2 wirtualnej należy użyć sterownika 4.7-1.0.0.1 Mellanox OFED.

Ze względu na zwiększoną ilość pamięci procesora GPU nowa maszyna ND40rs_v2 wirtualna wymaga użycia maszyn wirtualnych generacji 2 i obrazów z witryny Marketplace.

Uwaga: procesory ND40s_v2 16 GB pamięci na procesor GPU nie są już dostępne w wersji zapoznawczej i zostały nadane przez zaktualizowane ND40rs_v2.


Premium Storage:Obsługiwane
Premium Storage buforowania:obsługiwane
dyski w warstwie Ultra:Obsługiwane(Dowiedz się więcej o dostępności, użyciu i wydajności)
migracja na żywo:nie jest obsługiwana
Aktualizacje zachowujące pamięć:nie są obsługiwane
Obsługa generacji maszyny wirtualnej:generacja 2
Przyspieszona sieć:obsługiwana
Efemeracyjne dyski systemu operacyjnego:obsługiwane(w wersji zapoznawczej)
InfiniBand: obsługiwane
Nvidia NVLink Interconnect: obsługiwane

Rozmiar Procesor wirtualny Pamięć: GiB Magazyn tymczasowy (SSD): GiB Procesory GPU Pamięć procesora GPU: GiB Maks. liczba dysków danych Maksymalna przepływność niebuforowanych dysków: liczba operacji we/wy na sekundę / MB/s Maksymalna przepustowość sieci Maksymalna liczba kart sieciowych
Standard_ND40rs_v2 40 672 2948 8 V100 32 GB (NVLink) 32 32 80000 / 800 24000 Mb/s 8

Definicje tabel rozmiaru

  • Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). W przypadku porównywania dysków mierzonych w GB (1000 ^ 3 bajtów) z dyskami mierzonymi w GiB (1024 ^ 3) Pamiętaj, że numery pojemności określone w GiB mogą być mniejsze. Na przykład 1023 GiB = 1098,4 GB.

  • Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.

  • Dyski danych mogą działać w trybie buforowanym lub niebuforowanym. Dla pracy dysku danych w trybie buforowanym tryb pamięci podręcznej hosta jest ustawiony na wartość ReadOnly lub ReadWrite. Dla pracy dysku danych bez buforowania tryb pamięci podręcznej hosta jest ustawiony na wartość None.

  • Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz wydajność maszyn wirtualnych i dysków.

  • Oczekiwana przepustowość sieci to maksymalna zagregowana przepustowość przyalokowana na typ maszyny wirtualnej dla wszystkich kart sieciowych dla wszystkich miejsc docelowych. Aby uzyskać więcej informacji, zobacz przepustowość sieci maszyny wirtualnej.

    Górne limity nie są gwarantowane. Ogranicza wskazówki dotyczące wybierania odpowiedniego typu maszyny wirtualnej dla zamierzonej aplikacji. Rzeczywista wydajność sieci będzie zależeć od kilku czynników, w tym przeciążenia sieci, obciążeń aplikacji i ustawień sieciowych. Aby uzyskać informacje na temat optymalizowania przepływności sieci, zobacz Optymalizowanie przepływności sieci dla maszyn wirtualnych platformy Azure. Aby osiągnąć oczekiwaną wydajność sieci w systemie Linux lub Windows, może być konieczne wybranie określonej wersji lub jej zoptymalizowanie. Aby uzyskać więcej informacji, zobacz testowanie przepustowości/przepływności (NTTTCP).

Obsługiwane systemy operacyjne i sterowniki

Aby skorzystać z możliwości procesora GPU maszyn wirtualnych z serii N platformy Azure, należy zainstalować sterowniki procesora GPU firmy NVIDIA.

Rozszerzenie sterownika procesora GPU firmy NVIDIA instaluje odpowiednie sterowniki NVIDIA CUDA lub GRID na maszynie wirtualnej serii N. Zainstaluj rozszerzenie lub zarządzaj tym rozszerzeniem przy użyciu Azure Portal narzędzi, takich jak Azure PowerShell lub Azure Resource Manager szablonów. Aby uzyskać ogólne informacje na temat rozszerzeń maszyn wirtualnych, zobacz Rozszerzenia i funkcje maszyn wirtualnych platformy Azure.

Jeśli zdecydujesz się zainstalować sterowniki procesora GPU firmy NVIDIA ręcznie, zobacz N-series GPU driver setup for Linux(Konfiguracja sterownika procesora GPU serii N dla systemu Linux).

Inne rozmiary

Następne kroki

Dowiedz się więcej o tym, jak jednostki obliczeniowe platformy Azure (ACU) mogą pomóc w porównaniu wydajności obliczeniowej między jednostkami SKU platformy Azure.