Konfigurera och optimera virtuella datorer

Varning

Den här artikeln refererar till CentOS, en Linux-distribution som närmar sig EOL-status (End Of Life). Överväg att använda och planera i enlighet med detta. Mer information finns i CentOS End Of Life-vägledningen.

Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar

Den här artikeln innehåller lite vägledning om hur du konfigurerar och optimerar infiniBand-aktiverade virtuella HB-serier och virtuella datorer i N-serien för HPC.

VM-avbildningar

På infiniBand-aktiverade virtuella datorer (IB) krävs lämpliga IB-drivrutiner för att aktivera RDMA.

  • Ubuntu-HPC VM-avbildningarna på Marketplace är förkonfigurerade med lämpliga NVIDIA IB-drivrutiner och GPU-drivrutiner.
  • AlmaLinux-HPC VM-avbildningarna på Marketplace är förkonfigurerade med lämpliga NVIDIA IB-drivrutiner och GPU-drivrutiner.

Dessa VM-avbildningar baseras på basavbildningarna för virtuella datorer med Ubuntu och AlmaLinux Marketplace. Skript som används för att skapa dessa VM-avbildningar från deras basmarknadsavbildningar finns på lagringsplatsen azhpc-images.

På GPU-aktiverade virtuella datorer i N-serien krävs även lämpliga GPU-drivrutiner. Detta kan vara tillgängligt med följande metoder:

  • Använd Ubuntu-HPC VM-avbildningar eller AlmaLinux-HPC VM-avbildningar som är förkonfigurerade med NVIDIA GPU-drivrutinerna och GPU-beräkningsprogramvarans stack (CUDA, NCCL).
  • Lägg till GPU-drivrutinerna via VM-tilläggen.
  • Installera GPU-drivrutinerna manuellt.
  • Vissa andra VM-avbildningar på Marketplace är också förinstallerade med NVIDIA GPU-drivrutiner, inklusive vissa VM-avbildningar från NVIDIA.

Beroende på arbetsbelastningarnas Linux-distribution och versionsbehov är Ubuntu-HPC VM-avbildningar och AlmaLinux-HPC VM-avbildningar på Marketplace det enklaste sättet att komma igång med HPC- och AI-arbetsbelastningar i Azure. Vi rekommenderar också att du skapar anpassade VM-avbildningar med arbetsbelastningsspecifik anpassning och konfiguration för återanvändning.

VM-storlekar som stöds av HPC VM-avbildningar

InfiniBand OFED-stöd

De senaste Azure HPC Marketplace-avbildningarna levereras med Mellanox OFED 5.1 och senare, som inte stöder Anslut X3-Pro InfiniBand-kort. Anslut X-3 Pro InfiniBand-kort kräver MOFED 4.9 LTS-version. Dessa VM-avbildningar stöder endast ConnextX-5- och nyare InfiniBand-kort. Följande stödmatris för VM-storlek för InfiniBand OFED i dessa HPC VM-avbildningar:

Stöd för GPU-drivrutin

För närvarande är det bara Ubuntu-HPC VM-avbildningar och AlmaLinux-HPC VM-avbildningar som är förkonfigurerade med NVIDIA GPU-drivrutinerna och GPU-beräkningsprogramvarans stack (CUDA, NCCL).

Stödmatrisen för VM-storlek för GPU-drivrutinerna i HPC VM-avbildningar som stöds är följande:

  • N-serien: NDv2, NDv4 VM-storlekar stöds med NVIDIA GPU-drivrutiner och GPU Compute Software Stack (CUDA, NCCL).
  • De andra vm-storlekarna "NC" och "ND" i N-serien stöds med NVIDIA GPU-drivrutinerna.

Alla vm-storlekar i N-serien stöder virtuella Datorer i Gen 2, men vissa äldre har också stöd för virtuella Gen 1-datorer. Gen 2-stöd anges också med "01" i slutet av avbildningens URN eller version.

SR-IOV-aktiverade virtuella datorer

Ubuntu-HPC VM-avbildningar

För SR-IOV-aktiverade RDMA-kompatibla virtuella datorer är Ubuntu-HPC VM-avbildningar versionerna 18.04, 20.04 och 22.04 lämpliga. Dessa VM-avbildningar är förkonfigurerade med Mellanox OFED-drivrutiner för RDMA, NVIDIA GPU-drivrutiner, GPU-beräkningsprogramvara (CUDA, NCCL) och vanliga MPI-bibliotek och paket för vetenskaplig databehandling. Se stödmatrisen för VM-storlek.

  • De tillgängliga eller senaste versionerna av VM-avbildningarna kan visas med följande information med hjälp av CLI eller Marketplace.

    "publisher": "Microsoft-DSVM",
    "offer": "Ubuntu-HPC",
    
  • Skript som används för att skapa Ubuntu-HPC VM-avbildningar från en grundläggande Ubuntu Marketplace-avbildning finns på lagringsplatsen azhpc-images.

Vm-avbildningar av AlmaLinux-HPC

För SR-IOV-aktiverade RDMA-kompatibla virtuella datorer är AlmaLinux-HPC VM-avbildningar versionerna 8.5, 8.6 och 8.7 lämpliga. Dessa VM-avbildningar är förkonfigurerade med Mellanox OFED-drivrutiner för RDMA, NVIDIA GPU-drivrutiner, GPU-beräkningsprogramvara (CUDA, NCCL) och vanliga MPI-bibliotek och paket för vetenskaplig databehandling. Se stödmatrisen för VM-storlek.

  • De tillgängliga eller senaste versionerna av VM-avbildningarna kan visas med följande information med hjälp av CLI eller Marketplace.

    "publisher": "AlmaLinux",
    "offer": "AlmaLinux-HPC",
    
  • Skript som används för att skapa virtuella AlmaLinux-HPC-avbildningar från en grundläggande AlmaLinux Marketplace-avbildning finns på lagringsplatsen azhpc-images.

Dessutom finns information om vad som ingår i Ubuntu-HPC VM-avbildningar och AlmaLinux-HPC VM-avbildningar och hur du distribuerar dem i en TechCommunity-artikel.

Kommentar

Vi använde för att stödja CentOS-HPC VM-avbildningar. På grund av utfasningen av CentOS (för närvarande kommer den enda version centOS 7 som stöds att fortsätta att ta emot communityns säkerhetskorrigeringar och uppdateringar av buggkorrigeringar förrän i juni 2024) släpper vi inga nya CentOS HPC-avbildningar till Azure Marketplace. CentOS/RHEL-användare rekommenderas att använda våra Alternativ för AlmaLinux-HPC-avbildningar på Azure Marketplace, som har samma uppsättning drivrutiner installerade som andra HPC-avbildningar.

RHEL/CentOS VM-avbildningar

De grundläggande RHEL- eller CentOS-baserade icke-HPC VM-avbildningarna på Marketplace kan konfigureras för användning på de SR-IOV-aktiverade RDMA-kompatibla virtuella datorerna. Läs mer om att aktivera InfiniBand och konfigurera MPI på de virtuella datorerna.

Ubuntu VM-avbildningar

De grundläggande Ubuntu Server 20.04 LTS- och 22.04 LTS VM-avbildningarna på Marketplace stöds för både SR-IOV och icke-SR-IOV RDMA-kompatibla virtuella datorer. Läs mer om att aktivera InfiniBand och konfigurera MPI på de virtuella datorerna.

  • Instruktioner för att aktivera InfiniBand på Ubuntu VM-avbildningarna finns i en TechCommunity-artikel.

Kommentar

Mellanox OFED 5.1 och senare stöder inte Anslut X3-Pro InfiniBand-kort på SR-IOV-aktiverade vm-storlekar i N-serien med FDR InfiniBand (t.ex. NCv3). Använd LTS Mellanox OFED version 4.9-0.1.7.0 eller äldre på den virtuella N-seriens virtuella datorer med Anslut X3-Pro-kort. Mer information finns i Linux InfiniBand-drivrutiner.

Avbildningar av virtuella SUSE Linux Enterprise Server-datorer

SLES 12 SP3 för HPC, SLES 12 SP3 för HPC (Premium), SLES 12 SP1 för HPC, SLES 12 SP1 för HPC (Premium), SLES 12 SP4- och SLES 15 VM-avbildningar på Marketplace stöds. De här VM-avbildningarna är förinstallerade med Nätverksdirigeringsdrivrutinerna för RDMA (på vm-storlekar som inte är SR-IOV) och Intel MPI version 5.1. Läs mer om hur du konfigurerar MPI på de virtuella datorerna.

Optimera virtuella datorer

Följande är några valfria optimeringsinställningar för bättre prestanda på den virtuella datorn.

Uppdatera LIS

Om det behövs för funktioner eller prestanda kan Lis-drivrutiner (Linux Integration Services) installeras eller uppdateras på operativsystemdistributioner som stöds, särskilt när du distribuerar med en anpassad avbildning eller en äldre operativsystemversion, till exempel CentOS/RHEL 6.x eller tidigare version av 7.x.

wget https://aka.ms/lis
tar xzf lis
pushd LISISO
sudo ./upgrade.sh

Återta minne

Förbättra prestandan genom att automatiskt frigöra minne för att undvika fjärråtkomst till minnet.

sudo echo 1 >/proc/sys/vm/zone_reclaim_mode

Behåll beständigt minnesläge efter omstart av virtuell dator:

sudo echo "vm.zone_reclaim_mode = 1" >> /etc/sysctl.conf sysctl -p

Inaktivera brandvägg och SELinux

sudo systemctl stop iptables.service
sudo systemctl disable iptables.service
sudo systemctl mask firewalld
sudo systemctl stop firewalld.service
sudo systemctl disable firewalld.service
sudo iptables -nL
sudo sed -i -e's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

Inaktivera cpupower

sudo service cpupower status

Om det är aktiverat inaktiverar du det:

sudo service cpupower stop
sudo systemctl disable cpupower

Konfigurera WALinuxAgent

sudo sed -i -e 's/# OS.EnableRDMA=y/OS.EnableRDMA=y/g' /etc/waagent.conf

Alternativt kan WALinuxAgent inaktiveras innan du kör ett jobb och aktiveras efter jobbet för maximal tillgänglighet för virtuella datorer till HPC-arbetsbelastningen.

Nästa steg