Akcelerátor cílových zón Azure pro vysokovýkonné výpočetní prostředí (HPC)

Akcelerátor cílových zón vysokovýkonného výpočetního prostředí (HPC) automatizuje nasazení prostředí. Toto prostředí poskytuje základní architekturu, kterou můžete přizpůsobit a vytvořit ucelený mechanismus nasazení pro kompletní řešení clusteru PROSTŘEDÍ HPC v Azure. Akcelerátor je kolekce opensourcových skriptů a šablon, které můžou připravit cílové zóny na podnikové úrovni. Může poskytnout specifický přístup k architektuře a referenční implementaci, která dodržuje architekturu a osvědčené postupy architektury architektury přechodu na cloud.

Zákazníci přecházejí na prostředí HPC různými způsoby, aby vyhovovaly obchodním potřebám, a akcelerátor cílové zóny PROSTŘEDÍ HPC můžete přizpůsobit tak, aby vznikla architektura, která odpovídá vašemu způsobu. Použití akcelerátoru pomáhá dát organizaci na cestu k udržitelnému škálování.

Implementace cílové zóny na podnikové úrovni

Akcelerátor cílové zóny PROSTŘEDÍ HPC předpokládá, že začínáte s cílovou zónou na podnikové úrovni, která byla úspěšně implementována. Další informace o tomto předpokladu najdete v následujících článcích:

Co akcelerátor cílové zóny PROSTŘEDÍ HPC poskytuje

Přístup k cílovým zónám akcelerátoru cílových zón PROSTŘEDÍ HPC poskytuje vašemu projektu následující prostředky:

  • Modulární přístup, abyste mohli přizpůsobit proměnné prostředí
  • Pokyny k návrhu, které vám pomůžou vyhodnotit kritická rozhodnutí
  • Architektura cílové zóny
  • Implementace, která zahrnuje:
    • Nasaditelná referenční příručka umožňující vytvoření prostředí pro nasazení prostředí HPC
    • Referenční implementace prostředí HPC schválená Microsoftem pro otestování nasazeného prostředí

Pokyny k návrhu pro energii, výrobu a finance

Architektury cílových zón se liší podle obchodního sektoru, kromě toho, že se liší podle organizace. Tato část obsahuje články podle sektorů, které obsahují pokyny pro vytváření cílové zóny:

Pokyny pro návrh pro výběr výpočetních prostředků PROSTŘEDÍ HPC pro úlohy AI

Volba správné skladové položky gpu optimalizované pro úlohy AI je důležitá pro optimalizaci výkonu a řízení nákladů. Microsoft nabízí mnoho různých skladových položek, které jsou optimalizované pro úlohy, které využívají větší výkon GPU. Při výběru správné skladové položky pro úlohy AI je potřeba vzít v úvahu několik aspektů. Menší úlohy můžou využívat jenom zlomek procesoru, GPU a šířky pásma výkonnějších skladových položek, jako je NDv4. U menších úloh můžete zvážit jiné skladové položky výpočetních prostředků, jako jsou NCv4 a NDv2. Tady je několik důležitých aspektů při výběru správné skladové položky gpu optimalizované pro úlohy AI:

  • Vytváření kontrolních bodů Při spouštění modelů strojového učení zvažte faktory, jako je interval kontrolního bodu. To může mít vliv na výkon GPU během fáze trénování. Zajištění rovnováhy mezi efektivitou úložiště a udržováním hladkých operací GPU. Monitorujte využití GPU.
  • Odvozování. Odvozování požadavků se liší od požadavků na trénování s možným vyšším zatížením procesoru, které může dosáhnout maximálního výkonu procesoru. Při výběru skladové položky výpočetních prostředků zvažte odvozování požadavků modelu. Monitorujte využití procesoru.
  • Trénování: Při trénování zvažte požadavky modelu a monitorujte využití procesoru i GPU.
  • Určení velikosti úlohy Při zvažování skladové položky výpočetních prostředků pro úlohy AI zvažte velikost úlohy. Menší úlohy, například přibližně OPT 1.3B, nemusí využívat větší velikosti skladových položek a v závislosti na fázi úlohy (odvozování, trénování) můžou ponechat procesor a GPU nečinné.
  • Šířky pásma. Větší a nižší šířka pásma latence může být výdaje, když se nevyužívají. Zvažte InfiniBand pouze pro největší modely, které budou vyžadovat další šířku pásma.

Prohlédněte si velikosti virtuálních počítačů optimalizovaných pro GPU v Azure.

Příklad: koncepční referenční architektura pro energii

Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro energetické prostředí.

Diagram that shows an example architecture for an energy environment, including compute, storage, subnets, a database, and a front end for on-premises users.

Příklad: koncepční referenční architektura pro finance

Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro finanční prostředí.

Diagram that shows an example architecture for a finance environment, including on-premises resources, virtual network, subnets, and network security groups.

Příklad: koncepční referenční architektura pro výrobu

Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro výrobní prostředí.

Diagram that shows an example architecture for a manufacturing environment, including on-premises and cloud resources and an HPC landing zone.

Získání akcelerátoru cílových zón PROSTŘEDÍ HPC

Akcelerátor cílové zóny PROSTŘEDÍ HPC je k dispozici na GitHubu: Azure HPC OnDemand Platform Accelerator

Další kroky

Důležité informace a doporučení pro architekturu akcelerátoru cílových zón PROSTŘEDÍ HPC najdete v důležitých oblastech návrhu akcelerátoru cílových zón PROSTŘEDÍ HPC ve službě Azure Identity and Access Management.