VM-Leistung der HBv3-Serie

Gilt für: ✔️ Linux-VMs ✔️ Windows-VMs ✔️ Flexible Skalierungsgruppen ✔️ Einheitliche Skalierungsgruppen

Gemäß allgemeiner HPC-Mikrobenchmarks lauten die Leistungserwartungen wie folgt:

Workload HBv3
STREAM Triad 330-350 GB/s (verstärkt bis zu 630 GB/s)
High-Performance Linpack (HPL) 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) für VM-Größen mit 120 Kernen
RDMA-Wartezeit und -Bandbreite 1,2 Mikrosekunden (1 Byte), 192 GB/s (unidirektional)
FIO auf lokalen NVMe-SSDs (RAID0) 7 GB/s Lesevorgänge, 3 GB/s Schreibvorgänge; 186k IOPS-Lesevorgänge, 201k IOPS-Schreibvorgänge

Feste Prozesszuordnung

Die feste Prozesszuordnung eignet sich gut für VMs der HBv3-Serie, da der zugrunde liegende Chip unverändert für die Gast-VM zur Verfügung gestellt wird. Aus Leistungs- und Konsistenzgründen wird dringend empfohlen, Prozesse fest zuzuordnen.

MPI-Latenz

Der MPI-Wartezeittest der OSU-Mikrobenchmarksuite kann wie gezeigt ausgeführt werden. Beispielskripts finden Sie auf GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

MPI-Bandbreite

Der MPI-Bandbreitentest der OSU-Mikrobenchmarksuite kann wie unten gezeigt ausgeführt werden. Beispielskripts finden Sie auf GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

Das Paket Mellanox Perftest enthält viele InfiniBand-Tests, z. B. Latenz (ib_send_lat) und Bandbreite (ib_send_bw). Im Folgenden finden Sie einen Beispielbefehl.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Nächste Schritte