Планирование развертывания CycleCloud Production

Статья
06/21/2023

Развертывание Azure CycleCloud

Решите, какая версия CycleCloud будет развернута:
- Azure CycleCloud 8.2 — текущий выпуск
- Azure CycleCloud 7.9 — предыдущий выпуск
Подготовка подписки Azure путем определения подписки, виртуальной сети, подсети и группы ресурсов для развертывания сервера CycleCloud
Определите , какая группа ресурсов будет размещать кластеры или если CycleCloud должна создать их (параметр по умолчанию)
Создание учетной записи хранения для доступа к хранилищу
Определение того, будут ли использоваться ключи SSH, AD или LDAP для проверки подлинности.
Определите, будет ли CycleCloud использовать субъект-службу или управляемое удостоверение (рекомендуется с одной подпиской) Выбор между субъектом-службой и управляемым удостоверением
Подтвердите, какой номер SKU будет использоваться для CycleCloud: требования к системе CycleCloud
Будет ли среда развернута в заблокированной сети? В этом случае учитывайте следующие требования: работа в заблокированной сети
Развертывание сервера CycleCloud

Предупреждение

Убедитесь, что параметр "Включить иерархическое пространство имен" для Azure Data Lake Storage 2-го поколения не задан во время создания учетной записи хранения. CycleCloud не может использовать хранилище BLOB-объектов с поддержкой ADLS 2-го поколения в качестве хранилища.

Конфигурация Azure CycleCloud

Войдите на сервер CycleCloud, создайте сайт и учетную запись администратора CycleCloud: CycleCloud Setup
Создание хранилища CycleCloud , указывающего на учетную запись хранения

Конфигурация кластера Azure CycleCloud

Определение доступа пользователей к управлению пользователями кластеров
Определите, какой планировщик будет использоваться
Определите, какой номер SKU потребуется для планировщика или головного узла
Определите, какие номера SKU потребуются для узлов вычислений и выполнения. Это будет полностью зависеть от выполняемого приложения.
Будут ли кластеры развертываться с помощью шаблона или вручную?
- Шаблоны кластера должны быть определены и отправлены в хранилище: справочник по шаблонам кластера
- Создание вручную: создание нового кластера
Будут ли все скрипты выполняться на планировщике или выполнять узлы после развертывания:
- Cluster-Init
- Cloud-Init

Приложения

Какие зависимости (библиотеки и т. д.) имеют приложения? Как они будут доступны?
Сколько времени занимает установка и установка приложения? Это может определить, как приложение становится доступным для выполнения узлов и может потребовать пользовательского образа.
Существуют ли зависимости лицензий, которые необходимо учитывать? Нужно ли приложению связаться с локальным сервером лицензирования?
Определите, откуда будут выполняться приложения, это будет зависеть от времени установки и требований к производительности:
- С помощью пользовательского образа:
  - Пользовательские образы в кластере CycleCloud
  - Создание образа Linux клиента
- Использование образа Marketplace
- Из общей папки NFS, хранилища BLOB-объектов, Azure NetApp Files
Существует ли определенный номер SKU виртуальной машины, в котором должны использоваться приложения для запуска? Будет ли MPI требованием, так как это потребует другого семейства машин, таких как серия H?
- Размеры виртуальных машин Azure — HPC
- Рекомендации по кластеру HB/HC
Какое число ядер будет оптимальным для каждого задания для каждого приложения?
Можно ли использовать точечные виртуальные машины? Использование точечных виртуальных машин в CycleCloud
Убедитесь, что квоты подписки установлены для выполнения основных требований для приложений.

Данные

Определите, где будут находиться входные данные Azure. Это зависит от производительности приложений и размера данных.
- Локально на узлах выполнения
- Из общей папки NFS
- В хранилище BLOB-объектов
- Использование Azure NetApp Files
Определение необходимости последующей обработки выходных данных
Определите, где будут находиться выходные данные после завершения обработки
Нужно ли копировать его в другое место?
Какие требования к архиву и резервному копированию существуют?

Отправка задания

Как пользователи будут отправлять задания?
Будет ли у них есть скрипт для запуска на виртуальной машине планировщика или будет ли интерфейс для отправки данных и отправки заданий?

Резервное копирование и аварийное восстановление

Будут ли шаблоны использоваться для создания кластера? Это сделает повторное создание сервера CycleCloud намного быстрее и согласованно в разных развертываниях.
Каковы требования к аварийному восстановлению? Что произойдет с бизнесом, если регион Azure не был доступен должным образом?
Существуют ли соглашения об уровне обслуживания приложений, определенные внутренним бизнесом?
Можно ли использовать другой регион в качестве резервного сервера?
Выполняются ли длительные задания? Будет ли полезно контрольные точки?