CycleCloud 프로덕션 배포 계획

Azure CycleCloud 배포

경고

스토리지 계정을 만드는 동안 Azure Data Lake Storage Gen 2에 대해 "계층 구조 네임스페이스 사용"이 설정되지 않았는지 확인합니다. CycleCloud는 Storage Locker로 ADLS Gen 2를 사용하도록 설정된 Blob Storage를 사용할 수 없습니다.

Azure CycleCloud 구성

Azure CycleCloud 클러스터 구성

  • 클러스터 클러스터 사용자 관리에 대한 사용자 액세스 정의
  • 사용할 스케줄러 결정
  • 스케줄러/헤드 노드에 필요한 SKU 결정
  • 컴퓨팅/실행 노드에 필요한 SKU를 결정합니다. 이는 실행 중인 애플리케이션에 전적으로 종속됩니다.
  • 클러스터는 템플릿을 사용하여 배포되나요 아니면 수동으로 배포되나요?
  • 모든 스크립트가 스케줄러에서 실행되거나 배포된 후에 노드를 실행해야 합니다.

애플리케이션

  • 애플리케이션에는 어떤 종속성(라이브러리 등)이 있나요? 이러한 항목은 어떻게 사용할 수 있나요?
  • 애플리케이션을 설치하고 설치하는 데 얼마나 걸리나요? 이렇게 하면 애플리케이션을 실행 노드에 사용할 수 있는 방법을 결정할 수 있으며 사용자 지정 이미지가 필요할 수 있습니다.
  • 고려해야 하는 라이선스 종속성이 있나요? 애플리케이션이 온-프레미스 라이선스 서버에 연결해야 합니까?
  • 애플리케이션이 실행될 위치를 결정합니다. 설치 시간 및 성능 요구 사항에 따라 달라집니다.
  • 애플리케이션을 실행하는 데 사용해야 하는 특정 VM SKU가 있나요? MPI는 H 시리즈와 같은 다른 컴퓨터 제품군이 필요하기 때문에 요구 사항이 되나요?
  • 각 애플리케이션에 대한 작업당 최적 코어 수는 어떻게 되나요?
  • 스폿 VM을 사용할 수 있나요? CycleCloud에서 스폿 VM 사용
  • 애플리케이션의 핵심 요구 사항을 충족하기 위해 구독 할당량 이 있는지 확인합니다.

데이터

  • Azure에서 입력 데이터가 상주할 위치를 결정합니다. 이는 애플리케이션 및 데이터 크기의 성능에 따라 달라집니다.
    • 실행 노드에서 로컬로
    • NFS 공유에서
    • Blob Storage에서
    • Azure NetApp Files 사용
  • 출력 데이터에 사후 처리가 필요한지 확인
  • 처리가 완료되면 출력 데이터가 상주할 위치 결정
  • 다른 곳에서 복사해야 합니까?
  • 어떤 보관/백업 요구 사항이 있나요?

작업 제출

  • 사용자는 작업을 어떻게 제출합니까?
  • 스케줄러 VM에서 실행할 스크립트가 있나요? 아니면 데이터 업로드 및 작업 제출에 도움이 되는 프런트 엔드가 있나요?

Backup 및 재해 복구

  • 클러스터 만들기에 템플릿이 사용되나요? 이렇게 하면 배포 전체에서 CycleCloud 서버를 훨씬 더 빠르고 일관되게 다시 만들 수 있습니다.
  • 재해 복구에 대한 요구 사항은 무엇인가요? Azure 지역을 예상대로 사용할 수 없는 경우 비즈니스는 어떻게 될까요?
  • 내부 비즈니스에서 정의한 애플리케이션 SLA가 있나요?
  • 다른 지역을 대기로 사용할 수 있나요?
  • 작업이 오래 실행되고 있나요? 검사점이 도움이 되나요?