Zaktualizowano serię NDv2

Artykuł
06/01/2023

Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows — elastyczne zestawy ✔️ ✔️ skalowania

Maszyna wirtualna serii NDv2 to nowy dodatek do rodziny procesorów GPU zaprojektowany pod kątem potrzeb najbardziej wymagających obciążeń sztucznej inteligencji przyspieszanej przez procesor GPU, uczenia maszynowego, symulacji i HPC.

NDv2 jest zasilany przez 8 procesorów GPU NVIDIA Tesla V100 NVLINK, z których każda ma 32 GB pamięci procesora GPU. Każda maszyna wirtualna NDv2 ma również 40 rdzeni innych niż HyperThreaded Intel Xeon Platinum 8168 (Skylake) i 672 GiB pamięci systemowej.

Wystąpienia NDv2 zapewniają doskonałą wydajność dla obciążeń HPC i AI korzystających z jądra obliczeń zoptymalizowanych pod kątem procesora GPU CUDA oraz wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne platformy.

Krytycznie serwer NDv2 jest tworzony zarówno pod kątem intensywnego skalowania obliczeniowego (wykorzystującego 8 procesorów GPU na maszynę wirtualną) i skalowalnego w poziomie (wykorzystującego wiele maszyn wirtualnych pracujących razem). Seria NDv2 obsługuje teraz sieć zaplecza 100 Gigabit InfiniBand EDR, podobną do dostępnej w serii HB maszyny wirtualnej HPC, aby umożliwić klastrowanie o wysokiej wydajności dla scenariuszy równoległych, w tym trenowanie rozproszone dla sztucznej inteligencji i uczenia maszynowego. Ta sieć zaplecza obsługuje wszystkie główne protokoły InfiniBand, w tym te stosowane przez biblioteki NCCL2 firmy NVIDIA, co umożliwia bezproblemowe klastrowanie procesorów GPU.

Ważne

Podczas włączania rozwiązania InfiniBand na maszynie wirtualnej ND40rs_v2 użyj sterownika 4.7-1.0.0.1 Mellanox OFED.

Ze względu na zwiększoną pamięć procesora GPU nowa maszyna wirtualna ND40rs_v2 wymaga użycia maszyn wirtualnych generacji 2 i obrazów platformy handlowej.

Uwaga: ND40s_v2 z 16 GB pamięci na procesor GPU nie jest już dostępna do wersji zapoznawczej i została zastąpiona przez zaktualizowane ND40rs_v2.

Premium Storage: Obsługiwane
buforowanie Premium Storage: obsługiwane
Dyski w warstwie Ultra: Obsługiwane (dowiedz się więcej o dostępności, użyciu i wydajności)
Migracja na żywo: nieobsługiwana
Zachowanie pamięci Aktualizacje: nieobsługiwane
Obsługa generowania maszyn wirtualnych: generacja 2
Przyspieszona sieć: obsługiwana
Efemeryczne dyski systemu operacyjnego: obsługiwane
InfiniBand: obsługiwane
Nvidia NVLink Interconnect: obsługiwane
Wirtualizacja zagnieżdżona: nieobsługiwana

Rozmiar	Procesor wirtualny	Pamięć: GiB	Magazyn tymczasowy (SSD): GiB	Procesory GPU	Pamięć procesora GPU: GiB	Maks. liczba dysków danych	Maksymalna przepływność niebuforowanych dysków: liczba operacji we/wy na sekundę / MB/s	Maksymalna przepustowość sieci	Maksymalna liczba kart sieciowych
Standard_ND40rs_v2	40	672	2948	8 V100 32 GB (NVLink)	32	32	80000 / 800	24000 Mb/s	8

Obsługiwane systemy operacyjne i sterowniki

Aby móc korzystać z możliwości procesora GPU maszyn wirtualnych serii N platformy Azure, należy zainstalować sterowniki procesora GPU firmy NVIDIA.

Rozszerzenie sterownika procesora GPU FIRMY NVIDIA instaluje odpowiednie sterowniki NVIDIA CUDA lub GRID na maszynie wirtualnej serii N. Zainstaluj rozszerzenie lub zarządzaj nim przy użyciu Azure Portal lub narzędzi, takich jak szablony Azure PowerShell lub Azure Resource Manager. Aby uzyskać ogólne informacje na temat rozszerzeń maszyn wirtualnych, zobacz Rozszerzenia i funkcje maszyny wirtualnej platformy Azure.

Jeśli zdecydujesz się ręcznie zainstalować sterowniki procesora GPU FIRMY NVIDIA, zobacz Konfiguracja sterownika procesora GPU serii N dla systemu Linux.

Definicje tabel rozmiaru

Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). Podczas porównywania dysków mierzonych w GB (1000^3 bajtów) do dysków mierzonych w giB (1024^3) pamiętaj, że liczby pojemności podane w GiB mogą wydawać się mniejsze. Na przykład 1023 GiB = 1098,4 GB.
Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.
Dyski danych mogą działać w trybie buforowanym lub niebuforowanym. Dla pracy dysku danych w trybie buforowanym tryb pamięci podręcznej hosta jest ustawiony na wartość ReadOnly lub ReadWrite. Dla pracy dysku danych bez buforowania tryb pamięci podręcznej hosta jest ustawiony na wartość None.
Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz Wydajność maszyny wirtualnej i dysku.
Oczekiwana przepustowość sieci to maksymalna zagregowana przepustowość przydzielona na typ maszyny wirtualnej dla wszystkich kart sieciowych dla wszystkich miejsc docelowych. Aby uzyskać więcej informacji, zobacz Przepustowość sieci maszyny wirtualnej.

Górne limity nie są gwarantowane. Wskazówki dotyczące limitów dotyczące wybierania odpowiedniego typu maszyny wirtualnej dla zamierzonej aplikacji. Rzeczywista wydajność sieci będzie zależeć od kilku czynników, w tym przeciążenia sieci, obciążeń aplikacji i ustawień sieci. Aby uzyskać informacje na temat optymalizowania przepływności sieci, zobacz Optymalizowanie przepływności sieci dla maszyn wirtualnych platformy Azure. Aby osiągnąć oczekiwaną wydajność sieci w systemie Linux lub Windows, może być konieczne wybranie określonej wersji lub zoptymalizowanie maszyny wirtualnej. Aby uzyskać więcej informacji, zobacz Testowanie przepustowości/przepływności (NTTTCP).

Inne rozmiary i informacje

Kalkulator cen: Kalkulator cen

Aby uzyskać więcej informacji na temat typów dysków, zobacz Jakie typy dysków są dostępne na platformie Azure?

Następne kroki

Dowiedz się więcej o tym, jak jednostki obliczeniowe platformy Azure (ACU) mogą ułatwić porównanie wydajności obliczeń w jednostkach SKU platformy Azure.

Zaktualizowano serię NDv2

Obsługiwane systemy operacyjne i sterowniki

Definicje tabel rozmiaru

Inne rozmiary i informacje

Następne kroki

Dodatkowe zasoby