HB serisi sanal makinelere genel bakış

Dikkat

Bu makalede, Kullanım Süresi Sonu (EOL) durumuna yakın bir Linux dağıtımı olan CentOS'a başvuruda bulunur. Lütfen kullanımınızı göz önünde bulundurun ve uygun şekilde planlayın. Daha fazla bilgi için bkz . CentOS Kullanım Süresi Sonu kılavuzu.

Şunlar için geçerlidir: ✔️ Linux VM'leri ✔️ Windows VM'leri ✔️ Esnek ölçek kümeleri ✔️ Tekdüzen ölçek kümeleri

AMD EPYC'de yüksek performanslı işlem (HPC) uygulama performansının en üst düzeye çıkarılması, bellek yerleşimi ve süreç yerleşimi için düşünceli bir yaklaşım gerektirir. Aşağıda AMD EPYC mimarisini ve BUNU HPC uygulamaları için Azure'da uygulamamızı özetleyeceğiz. Fiziksel bir NUMA etki alanına başvurmak için "pNUMA" terimini ve sanallaştırılmış NUMA etki alanına başvurmak için "vNUMA" terimini kullanacağız.

Fiziksel olarak, HB serisi sunucu toplam 64 fiziksel çekirdek için 2 * 32 çekirdekli EPYC 7551 CPU'dur. Bu 64 çekirdek 16 pNUMA etki alanına (yuva başına 8) ayrılır ve bunların her biri dört çekirdektir ve "CPU Karmaşık" (veya "CCX") olarak bilinir. Her CCX'in kendi L3 önbelleği vardır ve bu da işletim sisteminin pNUMA/vNUMA sınırını nasıl göreceğidir. Bir çift bitişik CCX, iki fiziksel DRAM kanalına (HB serisi sunucularda 32 GB DRAM) erişimi paylaşır.

Azure hiper yöneticisinin VM'ye müdahale etmeden çalışmasına yer açmak için fiziksel pNUMA etki alanı 0'ı (ilk CCX) ayırırız. Ardından vm için pNUMA etki alanlarını 1-15 (kalan CCX birimleri) atarız. VM aşağıdakileri görür:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 VM başına çekirdek sayısı

VM'nin kendisi, pNUMA 0'ın kendisine verilmediğini bilmez. VM, vSocket 0 üzerinde 7 vNUMA ve vSocket 1 üzerinde 8 vNUMA ile pNUMA 1-15'i vNUMA 0-14 olarak anlar. Bu asimetrik olsa da işletim sisteminizin önyüklemesi ve normal şekilde çalışması gerekir. Bu kılavuzun ilerleyen bölümlerinde bu asimetrik NUMA düzeninde MPI uygulamalarının en iyi şekilde nasıl çalıştırılacaklarını anlatacağız.

Temeldeki silikonu konuk VM'de olduğu gibi kullanıma sunduğumuzdan işlem sabitleme HB serisi VM'lerde çalışır. En iyi performans ve tutarlılık için işlem sabitlemeyi kesinlikle öneririz.

Aşağıdaki diyagramda Azure Hiper Yöneticisi ve HB serisi VM için ayrılmış çekirdeklerin ayrıştırması gösterilmektedir.

Azure Hypervisor ve HB serisi VM için ayrılmış çekirdeklerin ayrılması

Donanım belirtimleri

Donanım Belirtimleri HB serisi VM
Çekirdekler 60 (SMT devre dışı)
CPU AMD EPYC 7551
CPU Sıklığı (AVX olmayan) ~2,55 GHz (tek + tüm çekirdekler)
Bellek 4 GB/çekirdek (toplam 240 GB)
Yerel Disk 700 GB SSD
Infiniband 100 Gb EDR Mellanox Bağlan X-5
50 Gb Ethernet (40 Gb kullanılabilir) Azure ikinci Nesil SmartNIC

Yazılım belirtimleri

Yazılım Belirtimleri HB serisi VM
En Fazla MPI İş Boyutu 18000 çekirdek (singlePlacementGroup=true ile tek bir sanal makine ölçek kümesinde 300 VM)
MPI Desteği HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Ek Çerçeveler UCX, libfabric, PGAS
Azure Depolama Desteği Standart ve Premium Diskler (en fazla 4 disk)
SRIOV RDMA için İşletim Sistemi Desteği CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Orchestrator Desteği CycleCloud, Batch, AKS; küme yapılandırma seçenekleri

Önemli

Bu belge, Linux'un Kullanım Süresi Sonu(EOL) veya yakınında olan bir sürüme başvurur. Lütfen daha güncel bir sürüme güncelleştirmeyi göz önünde bulundurun.

Sonraki adımlar