Реестры машинного обучения для MLOps

Из этой статьи вы узнаете, как масштабировать MLOps в средах разработки, тестирования и рабочей среде. Ваши среды могут варьироваться от нескольких до нескольких в зависимости от сложности ВАШЕЙ ИТ-среды и зависят от таких факторов, как:

  • Политики безопасности и соответствия требованиям. Необходимо ли изолировать рабочие среды от сред разработки с точки зрения управления доступом, сетевой архитектуры, раскрытия данных и т. д.?
  • Подписки . Среды разработки находятся в одной подписке, а рабочие среды — в другой подписке? Часто отдельные подписки используются для выставления счетов, бюджетирования и управления затратами.
  • Регионы. Требуется ли развертывание в разных регионах Azure для поддержки требований к задержке и избыточности?

В таких сценариях вы можете использовать разные рабочие области Машинного обучения Azure для разработки, тестирования и рабочей среды. Эта конфигурация представляет следующие проблемы при обучении и развертывании модели:

  • Необходимо обучить модель в рабочей области разработки, но развернуть ее конечную точку в рабочей рабочей области, возможно, в другой подписке или регионе Azure. В этом случае необходимо иметь возможность отследить задание обучения. Например, для анализа метрик, журналов, кода, среды и данных, используемых для обучения модели при возникновении проблем с точностью или производительностью в рабочем развертывании.
  • Вам необходимо разработать конвейер обучения с тестовых или анонимных данных в рабочей области разработки, но переобучить модель с помощью рабочих данных в рабочей рабочей области. В этом случае может потребоваться сравнить метрики обучения на выборке и в рабочей среде, чтобы убедиться, что оптимизация обучения работает хорошо с фактическими данными.

MLOps для нескольких рабочих областей с реестрами

Реестры, как и репозиторий Git, отделяют ресурсы машинного обучения от рабочих областей и размещают их в центральном расположении, делая их доступными для всех рабочих областей в организации.

Если вы хотите повысить уровень моделей в разных средах (dev, test, prod), начните с итеративной разработки модели в среде разработки. Если у вас есть хорошая модель-кандидат, ее можно опубликовать в реестре. Затем модель можно развернуть из реестра в конечных точках в разных рабочих областях.

Совет

Если у вас уже есть модели, зарегистрированные в рабочей области, их можно повысить до уровня реестра. Модель также можно зарегистрировать непосредственно в реестре из выходных данных задания обучения.

Если вы хотите разработать конвейер в одной рабочей области, а затем запустить его в других, начните с регистрации компонентов и сред, которые образуют стандартные блоки конвейера. При отправке задания конвейера рабочая область, в которой оно выполняется, выбирается данными вычислений и обучения, которые являются уникальными для каждой рабочей области.

На следующей схеме показано повышение уровня конвейеров между исследовательской и рабочей областью разработки, а затем повышение модели между средами разработки, тестирования и рабочей среды.

Схема использования конвейера и модели в разных средах.

Дальнейшие действия