Настройка рабочих областей машинного обучения

Среды машинного обучения и управление доступом на основе ролей

Среды разработки, тестирования и рабочие среды поддерживают рабочие процессы машинного обучения.

Схема, показывающая среды машинного обучения и управление доступом на основе ролей.

В среде разработки. Конвейеры машинного обучения должны поддерживать действия по инжинирингу, обработке и анализу данных, которые выполняются специалистами по обработке и анализу данных. Они должны иметь полные разрешения, связанные с выполнением экспериментов, например на подготовку кластеров для обучения или на создание моделей. Они не должны иметь разрешения на такие действия, как удаление или создание рабочих пространств, а также добавление или удаление пользователей рабочих областей.

В тестовой среде. В среде модели проводятся различные тесты, при этом для модели следует использовать либо тестирование "чемпион/претендент", либо A/B-тестирование. Тестовая среда должна имитировать среду развертывания и выполнять тесты, такие как нагрузочное тестирование, время отклика модели и другие. Специалисты по обработке и анализу данных имеют ограниченный доступ к этой среде, в основном доступ только для чтения и некоторые права на настройку. Разработчики DevOps имеют полный доступ к среде. Автоматизируйте как можно больше тестов. После завершения всех тестов для развертывания в рабочей среде требуется утверждение заинтересованными лицами.

В рабочей среде. Модель развертывается во время вывода пакетной службы или в режиме реального времени. Рабочая среда обычно доступна только для чтения, но разработчик DevOps имеет полный доступ к этой среде и отвечает за постоянную поддержку и обслуживание. Специалисты по инжинирингу, обработке и анализу данных имеют ограниченный доступ к среде, только для чтения.

Управление доступом на основе ролей для всех сред показано на следующей схеме:

Схема управления доступом на основе ролей для всех сред.

В этой таблице показано, что уровни доступа специалистов по инжинирингу, обработке и анализу данных понижается в средах более высокого уровня, тогда как уровень доступа разработчика DevOps повышается. Это связано с тем, что специалист по операциям машинного обучения создает конвейер, объединяет все элементы и развертывает модели в рабочей среде. Этот уровень детализации рекомендуется для каждой роли.

Факторы, влияющие на рабочие области машинного обучения

На настройку рабочих областей машинного обучения могут влиять многочисленные факторы, которые помогут вам определить оптимальную структуру и средства управления для каждого типа рабочей области.

Схема настройки рабочих областей Машинного обучения Azure.

  • Общедоступная, с ограниченным доступом:

    • рабочие области для разработки, тестирования и производства
    • Пользовательская роль: анализ данных
    • Интеграция Git для управления версиями, непрерывная поставка и непрерывная интеграция (CI/CD)
  • Общедоступная, с неограниченным доступом:

    • рабочие области для разработки, тестирования и производства
    • Роль: участник
    • Интеграция Git для управления версиями, непрерывная поставка и непрерывная интеграция
  • Частная, с ограничениями:

    • рабочие области для разработки, тестирования и производства
    • Приватный канал включен
    • Пользовательская роль: анализ данных
    • Интеграция Git для управления версиями, непрерывная поставка и непрерывная интеграция
  • Частный, без ограничений:

    • рабочие области для разработки, тестирования и производства
    • Приватный канал включен
    • Роль: участник
    • Интеграция Git для управления версиями, непрерывная поставка и непрерывная интеграция
  • Все рабочие области:

    • Одна рабочая область студии машинного обучения Azure на проект
    • Один вычислительный экземпляр на специалиста по обработке и анализу данных
    • Один вычислительный кластер на размер виртуальной машины, совместно используемый специалистами по анализу данных, для разработки
    • Один вычислительный кластер на рабочий конвейер
    • Установка значения 0 для минимального размера узла вычислительного кластера для снижения затрат
    • Инструкция для пользователей: завершить работу вычислительных экземпляров после использования вручную
    • Пользовательская роль администратора рабочей области с доступом для создания вычислительных экземпляров и кластеров
    • Пользовательская роль специалиста по обработке и анализу данных, которая требует, чтобы все инфраструктуры были настроены другим пользователем, прежде чем он сможет начать работу

Дальнейшие действия