Planera distributionen av CycleCloud-produktion

Artikel
06/21/2023

Azure CycleCloud-distribution

Bestäm vilken version av CycleCloud som ska distribueras:
- Azure CycleCloud 8.2 – aktuell version
- Azure CycleCloud 7.9 – föregående version
Förbereda din Azure-prenumeration genom att definiera vilken prenumeration, vNet, undernät och resursgrupp som ska distribueras till CycleCloud-servern
Definiera vilken resursgrupp som ska vara värd för kluster eller om CycleCloud ska skapa dem (standardinställning)
Skapa ett lagringskonto för att låsa åtkomst
Kontrollera om SSH-nycklar, AD eller LDAP kommer att användas för autentisering
Avgöra om CycleCloud ska använda tjänstens huvudnamn eller en hanterad identitet (rekommenderas med en enda prenumeration) Välja mellan tjänstens huvudnamn och en hanterad identitet
Bekräfta vilken SKU som ska användas för CycleCloud: Systemkrav för CycleCloud
Kommer miljön att distribueras i ett låst nätverk? I så fall bör du ta hänsyn till följande krav: Arbeta i ett låst nätverk
Distribuera CycleCloud-servern

Varning

Se till att "Aktivera hierarkiskt namnområde" för Azure Data Lake Storage Gen 2 inte har angetts när lagringskontot skapas. CycleCloud kan inte använda Blob Storage med ADLS Gen 2 aktiverat som lagringsskåp.

Azure CycleCloud-konfiguration

Logga in på CycleCloud-servern, skapa en webbplats och ett CycleCloud-administratörskonto: CycleCloud-installation
Skapa CycleCloud-skåp som pekar på lagringskontot

Azure CycleCloud-klusterkonfiguration

Definiera användaråtkomst till klusterhantering för klusteranvändare
Bestäm vilken schemaläggare som ska användas
Avgöra vilken SKU som krävs för schemaläggaren/huvudnoden
Ta reda på vilka SKU:er som krävs för beräknings-/körningsnoderna. Detta kommer att vara helt beroende av att programmet körs
Kommer kluster att distribueras med hjälp av en mall eller manuellt?
- Klustermallar måste definieras och laddas upp till skåpet: Referens för klustermall
- Manuellt skapande: Skapa ett nytt kluster
Måste alla skript köras på schemaläggaren eller köra noder när de har distribuerats:
- Cluster-Init
- Cloud-Init

Program

Vilka beroenden (bibliotek osv.) har programmen? Hur kommer dessa att göras tillgängliga?
Hur lång tid tar det att konfigurera och installera ett program? Detta kan avgöra hur ett program görs tillgängligt för körningsnoderna och kan kräva en anpassad avbildning.
Finns det några licensberoenden som måste beaktas? Behöver programmet kontakta en lokal licensserver?
Avgör var program ska köras från, detta beror på installationstider och prestandakrav:
- Via en anpassad avbildning:
  - Anpassade avbildningar i ett CycleCloud-kluster
  - Skapa en Linux-kunds avbildning
- Använda en Marketplace-avbildning
- Från en NFS-resurs, bloblagring, Azure NetApp Files
Finns det en specifik VM-SKU som måste användas för att programmen ska kunna köras? Kommer MPI att vara ett krav eftersom det skulle kräva en annan familj av maskiner som H-serien?
- Storlekar på virtuella Azure-datorer – HPC
- Metodtips för HB/HC-kluster
Vilket är det optimala antalet kärnor per jobb för varje program?
Kan virtuella datorer för oanvänd kapacitet användas? Använda virtuella datorer för oanvänd kapacitet i CycleCloud
Se till att prenumerationskvoter finns på plats för att uppfylla de grundläggande kraven för programmen

Data

Ta reda på var indata kommer att finnas i Azure. Detta beror på prestanda för program och datastorlek.
- Lokalt på körningsnoderna
- Från en NFS-resurs
- I Blob Storage
- Använda Azure NetApp Files
Ta reda på om det behövs någon efterbearbetning av utdata
Bestäm var utdata ska finnas när bearbetningen är klar
Behöver den kopieras någon annanstans?
Vilka krav på arkiv/säkerhetskopiering finns det?

Skicka jobb

Hur skickar användare jobb?
Kommer de att ha ett skript som ska köras på den virtuella schemaläggarens virtuella dator eller kommer det att finnas en klientdel som hjälper till med datauppladdning och jobböverföring?

Säkerhetskopiering och haveriberedskap

Kommer mallar att användas för att skapa kluster? Detta kommer att göra återskapandet av en CycleCloud-server mycket snabbare och konsekvent över distributioner
Vilka krav för haveriberedskap finns det? Vad skulle hända med verksamheten om en Azure-region inte var tillgänglig som förväntat?
Finns det några program-SLA:erna som definieras av den interna verksamheten?
Kan en annan region användas som vänteläge?
Körs jobben länge? Skulle kontrollpunkter vara till nytta?