Планирование развертывания CycleCloud Production

Развертывание Azure CycleCloud

Предупреждение

Убедитесь, что параметр "Включить иерархическое пространство имен" для Azure Data Lake Storage 2-го поколения не задан во время создания учетной записи хранения. CycleCloud не может использовать хранилище BLOB-объектов с поддержкой ADLS 2-го поколения в качестве хранилища.

Конфигурация Azure CycleCloud

Конфигурация кластера Azure CycleCloud

  • Определение доступа пользователей к управлению пользователями кластеров
  • Определите, какой планировщик будет использоваться
  • Определите, какой номер SKU потребуется для планировщика или головного узла
  • Определите, какие номера SKU потребуются для узлов вычислений и выполнения. Это будет полностью зависеть от выполняемого приложения.
  • Будут ли кластеры развертываться с помощью шаблона или вручную?
  • Будут ли все скрипты выполняться на планировщике или выполнять узлы после развертывания:

Приложения

  • Какие зависимости (библиотеки и т. д.) имеют приложения? Как они будут доступны?
  • Сколько времени занимает установка и установка приложения? Это может определить, как приложение становится доступным для выполнения узлов и может потребовать пользовательского образа.
  • Существуют ли зависимости лицензий, которые необходимо учитывать? Нужно ли приложению связаться с локальным сервером лицензирования?
  • Определите, откуда будут выполняться приложения, это будет зависеть от времени установки и требований к производительности:
  • Существует ли определенный номер SKU виртуальной машины, в котором должны использоваться приложения для запуска? Будет ли MPI требованием, так как это потребует другого семейства машин, таких как серия H?
  • Какое число ядер будет оптимальным для каждого задания для каждого приложения?
  • Можно ли использовать точечные виртуальные машины? Использование точечных виртуальных машин в CycleCloud
  • Убедитесь, что квоты подписки установлены для выполнения основных требований для приложений.

Данные

  • Определите, где будут находиться входные данные Azure. Это зависит от производительности приложений и размера данных.
    • Локально на узлах выполнения
    • Из общей папки NFS
    • В хранилище BLOB-объектов
    • Использование Azure NetApp Files
  • Определение необходимости последующей обработки выходных данных
  • Определите, где будут находиться выходные данные после завершения обработки
  • Нужно ли копировать его в другое место?
  • Какие требования к архиву и резервному копированию существуют?

Отправка задания

  • Как пользователи будут отправлять задания?
  • Будет ли у них есть скрипт для запуска на виртуальной машине планировщика или будет ли интерфейс для отправки данных и отправки заданий?

Резервное копирование и аварийное восстановление

  • Будут ли шаблоны использоваться для создания кластера? Это сделает повторное создание сервера CycleCloud намного быстрее и согласованно в разных развертываниях.
  • Каковы требования к аварийному восстановлению? Что произойдет с бизнесом, если регион Azure не был доступен должным образом?
  • Существуют ли соглашения об уровне обслуживания приложений, определенные внутренним бизнесом?
  • Можно ли использовать другой регион в качестве резервного сервера?
  • Выполняются ли длительные задания? Будет ли полезно контрольные точки?