Planera distributionen av CycleCloud-produktion

Azure CycleCloud-distribution

Varning

Se till att "Aktivera hierarkiskt namnområde" för Azure Data Lake Storage Gen 2 inte har angetts när lagringskontot skapas. CycleCloud kan inte använda Blob Storage med ADLS Gen 2 aktiverat som lagringsskåp.

Azure CycleCloud-konfiguration

Azure CycleCloud-klusterkonfiguration

  • Definiera användaråtkomst till klusterhantering för klusteranvändare
  • Bestäm vilken schemaläggare som ska användas
  • Avgöra vilken SKU som krävs för schemaläggaren/huvudnoden
  • Ta reda på vilka SKU:er som krävs för beräknings-/körningsnoderna. Detta kommer att vara helt beroende av att programmet körs
  • Kommer kluster att distribueras med hjälp av en mall eller manuellt?
  • Måste alla skript köras på schemaläggaren eller köra noder när de har distribuerats:

Program

  • Vilka beroenden (bibliotek osv.) har programmen? Hur kommer dessa att göras tillgängliga?
  • Hur lång tid tar det att konfigurera och installera ett program? Detta kan avgöra hur ett program görs tillgängligt för körningsnoderna och kan kräva en anpassad avbildning.
  • Finns det några licensberoenden som måste beaktas? Behöver programmet kontakta en lokal licensserver?
  • Avgör var program ska köras från, detta beror på installationstider och prestandakrav:
  • Finns det en specifik VM-SKU som måste användas för att programmen ska kunna köras? Kommer MPI att vara ett krav eftersom det skulle kräva en annan familj av maskiner som H-serien?
  • Vilket är det optimala antalet kärnor per jobb för varje program?
  • Kan virtuella datorer för oanvänd kapacitet användas? Använda virtuella datorer för oanvänd kapacitet i CycleCloud
  • Se till att prenumerationskvoter finns på plats för att uppfylla de grundläggande kraven för programmen

Data

  • Ta reda på var indata kommer att finnas i Azure. Detta beror på prestanda för program och datastorlek.
    • Lokalt på körningsnoderna
    • Från en NFS-resurs
    • I Blob Storage
    • Använda Azure NetApp Files
  • Ta reda på om det behövs någon efterbearbetning av utdata
  • Bestäm var utdata ska finnas när bearbetningen är klar
  • Behöver den kopieras någon annanstans?
  • Vilka krav på arkiv/säkerhetskopiering finns det?

Skicka jobb

  • Hur skickar användare jobb?
  • Kommer de att ha ett skript som ska köras på den virtuella schemaläggarens virtuella dator eller kommer det att finnas en klientdel som hjälper till med datauppladdning och jobböverföring?

Säkerhetskopiering och haveriberedskap

  • Kommer mallar att användas för att skapa kluster? Detta kommer att göra återskapandet av en CycleCloud-server mycket snabbare och konsekvent över distributioner
  • Vilka krav för haveriberedskap finns det? Vad skulle hända med verksamheten om en Azure-region inte var tillgänglig som förväntat?
  • Finns det några program-SLA:erna som definieras av den interna verksamheten?
  • Kan en annan region användas som vänteläge?
  • Körs jobben länge? Skulle kontrollpunkter vara till nytta?