HC 系列虛擬機器大小

HC 系列的大小已執行數項效能測試。 以下是此效能測試的一些結果。

工作負載 HB
資料流程三角理論 190 GB/秒 (Intel LIP.MLC AVX-512)
High-Performance Linpack (HPL) 3520 GigaFLOPS (Rpeak) ,2970 GigaFLOPS (Rmax)
RDMA 延遲 & 頻寬 1.05 微秒、96.8 Gb/秒
在本機 NVMe SSD 上的 FIO 1.3 GB/s 讀取、900 MB/s 寫入
IOR on 4 Azure 進階 SSD (P30 受控磁碟,RAID0) * * 780 MB/s 讀取、780 MB/寫入

MPI 延遲

從 OSU microbenchmark suite 執行 MPI 延遲測試。 範例腳本位於 GitHub

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency 

Azure HC 上的 MPI 延遲。

MPI 頻寬

從 OSU microbenchmark suite 執行 MPI 頻寬測試。 範例腳本位於 GitHub

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Azure HC 上的 MPI 頻寬。

Mellanox Perftest

Mellanox Perftest 套件具有許多未測試的測試,例如延遲 (ib_send_lat) 和頻寬 (ib_send_bw) 。 以下是範例命令。

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

下一步