Реестры машинного обучения для MLOps
Из этой статьи вы узнаете, как масштабировать MLOps в средах разработки, тестирования и рабочей среде. Ваши среды могут варьироваться от нескольких до нескольких в зависимости от сложности ВАШЕЙ ИТ-среды и зависят от таких факторов, как:
- Политики безопасности и соответствия требованиям. Необходимо ли изолировать рабочие среды от сред разработки с точки зрения управления доступом, сетевой архитектуры, раскрытия данных и т. д.?
- Подписки . Среды разработки находятся в одной подписке, а рабочие среды — в другой подписке? Часто отдельные подписки используются для выставления счетов, бюджетирования и управления затратами.
- Регионы. Требуется ли развертывание в разных регионах Azure для поддержки требований к задержке и избыточности?
В таких сценариях вы можете использовать разные рабочие области Машинного обучения Azure для разработки, тестирования и рабочей среды. Эта конфигурация представляет следующие проблемы при обучении и развертывании модели:
- Необходимо обучить модель в рабочей области разработки, но развернуть ее конечную точку в рабочей рабочей области, возможно, в другой подписке или регионе Azure. В этом случае необходимо иметь возможность отследить задание обучения. Например, для анализа метрик, журналов, кода, среды и данных, используемых для обучения модели при возникновении проблем с точностью или производительностью в рабочем развертывании.
- Вам необходимо разработать конвейер обучения с тестовых или анонимных данных в рабочей области разработки, но переобучить модель с помощью рабочих данных в рабочей рабочей области. В этом случае может потребоваться сравнить метрики обучения на выборке и в рабочей среде, чтобы убедиться, что оптимизация обучения работает хорошо с фактическими данными.
MLOps для нескольких рабочих областей с реестрами
Реестры, как и репозиторий Git, отделяют ресурсы машинного обучения от рабочих областей и размещают их в центральном расположении, делая их доступными для всех рабочих областей в организации.
Если вы хотите повысить уровень моделей в разных средах (dev, test, prod), начните с итеративной разработки модели в среде разработки. Если у вас есть хорошая модель-кандидат, ее можно опубликовать в реестре. Затем модель можно развернуть из реестра в конечных точках в разных рабочих областях.
Совет
Если у вас уже есть модели, зарегистрированные в рабочей области, их можно повысить до уровня реестра. Модель также можно зарегистрировать непосредственно в реестре из выходных данных задания обучения.
Если вы хотите разработать конвейер в одной рабочей области, а затем запустить его в других, начните с регистрации компонентов и сред, которые образуют стандартные блоки конвейера. При отправке задания конвейера рабочая область, в которой оно выполняется, выбирается данными вычислений и обучения, которые являются уникальными для каждой рабочей области.
На следующей схеме показано повышение уровня конвейеров между исследовательской и рабочей областью разработки, а затем повышение модели между средами разработки, тестирования и рабочей среды.