Как настроить рабочие области машинного обученияHow to set up machine learning workspaces

Среды машинного обучения и управление доступом на основе ролейMachine learning environments and role-based access control

Разработка, тестирование и рабочие среды поддерживают процессы машинного обучения.Development, testing, and production environments support machine learning operations processes.

Схема, в которой показаны среды машинного обучения и управление доступом на основе ролей.

В среде разработки: Конвейеры машинного обучения должны поддерживать действия по обработке и анализу данных, которые выполняются специалистами по обработке и анализу данных.In a development environment: Machine learning pipelines should support the data science and engineering activities carried out by data scientists and data engineers. Они должны иметь полные разрешения, связанные с выполнением экспериментов, например подготовка кластеров для обучения или создание моделей.They should have full permissions related to running experiments, such as provisioning training clusters or building models. Однако они не должны иметь разрешения на такие действия, как удаление или создание рабочих областей, добавление или удаление пользователей рабочей области.However, they should not have permission for activities like deleting or creating workspaces, or adding or removing workspace users.

В тестовой среде: В среде модели выполняются различные тесты, и для модели следует использовать тестирование заслуженный член/чалленжер или A/B.In a test environment: Various tests are performed on the model's environment, and either champion/challenger or A/B testing should be used for the model. Тестовая среда должна имитировать среду развертывания и выполнять тесты, такие как нагрузочное тестирование, время отклика модели и другие.The test environment should mimic the deployment environment, and should run tests such as load testing, model response time, and others. Специалисты по обработке и анализу данных имеют ограниченный доступ к этой среде, в первую очередь доступ только для чтения и некоторые права на настройку.Data scientists and engineers have limited access to this environment, primarily read-only access and some configuration rights. Рука-инженер DevOps имеет полный доступ к среде.A DevOps engineer hand has full access to the environment. Автоматизируйте максимально возможное количество тестов.Automate as many tests as possible. После завершения всех тестов для развертывания в рабочей среде требуется утверждение заинтересованных лиц.Once all the tests are completed, stakeholder approval is required for deployment in the production environment.

В рабочей среде: Модель развертывается во время вывода пакетной службы или в режиме реального времени.In a production environment: A model is deployed during batch or real-time inference. Рабочая среда обычно доступна только для чтения. Однако инженер DevOps имеет полный доступ к этой среде и отвечает за постоянную поддержку и обслуживание.A production environment is typically read-only; however, a DevOps engineer has full access to this environment and is responsible for continually supporting and maintaining it. Специалисты по обработке и анализу данных имеют ограниченный доступ к среде и доступны только для чтения.Data scientists and data engineers have limited access to the environment, and it's read-only.

Управление доступом на основе ролей для всех сред показано на следующей схеме:Role-based access control for all environments is shown in the following diagram:

Схема управления доступом на основе ролей для всех сред.

В этой таблице показано, что уровни доступа инженера и анализу данных уменьшаются в более высоких средах, в то время как доступ к инженеру DevOps увеличивается.This table shows that the data engineer and data scientist's access levels decrease within higher environments while the DevOps engineer's access increases. Это связано с тем, что инженер эксплуатации машинного обучения строит конвейер, объединяет все вместе и развертывает модели в рабочей среде.This is because a machine learning operations engineer builds the pipeline, glues things together, and deploys models in production. Этот уровень гранулярности рекомендуется для каждой роли.This level of granularity is recommended for each role.

Факторы, влияющие на рабочие области машинного обученияFactors that influence machine learning workspaces

На настройку рабочих областей машинного обучения можно столкнуться несколькими факторами, которые могут помочь вам определить оптимальную структуру и элементы управления для каждого типа рабочей области:Multiple factors can influence how you set up your machine learning workspaces, and they can help you to determine the best structure and controls for each type of workspace:

Схема настройки рабочих областей Машинное обучение Azure.

  • Общедоступный, ограниченный:Public, restricted:

    • Рабочая область для разработки, тестирования и рабочей средыDevelopment, test, and production workspace
    • Пользовательская роль: анализу данныхCustom role: Data scientist
    • Интеграция Git для управления версиями, непрерывная интеграция и непрерывная разработка (CI/CD)Git integration for version control and continuous integration/continuous development (CI/CD)
  • Public, без ограничений:Public, unrestricted:

    • Рабочая область для разработки, тестирования и рабочей средыDevelopment, test, and production workspace
    • Роль — "Участник".Role: Contributor
    • Интеграция Git для управления версиями и НЕПРЕРЫВной интеграции и чтенияGit integration for version control and CI/CD
  • Частный, ограниченный:Private, restricted:

    • Рабочая область для разработки, тестирования и рабочей средыDevelopment, test, and production workspace
    • Закрытая ссылка включенаPrivate Link enabled
    • Пользовательская роль: анализу данныхCustom role: Data scientist
    • Интеграция Git для управления версиями и НЕПРЕРЫВной интеграции и чтенияGit integration for version control and CI/CD
  • Частный, без ограничений:Private, unrestricted:

    • Рабочая область для разработки, тестирования и рабочей средыDevelopment, test, and production workspace
    • Закрытая ссылка включенаPrivate Link enabled
    • Роль — "Участник".Role: Contributor
    • Интеграция Git для управления версиями и НЕПРЕРЫВной интеграции и чтенияGit integration for version control and CI/CD
  • Все рабочие области:All workspaces:

    • Одна рабочая область Машинное обучение Azure Studio для каждого проектаOne Azure Machine Learning studio workspace per project
    • Один вычислительный экземпляр на анализу данныхOne compute instance per data scientist
    • Один расчетный кластер на размер виртуальной машины, совместно используемый специалистами по анализу данных для разработкиOne compute cluster per virtual machine size shared with data scientists for development
    • Один расчетный кластер на рабочий конвейерOne compute cluster per production pipeline
    • Установка минимального размера узла для вычислений кластера в значение 0 для снижения затратSetting the compute cluster minimum node size to 0 to reduce costs
    • Указание пользователям завершить работу экземпляров вычислений вручную после использованияInstructing users to shut down compute instances manually after use
    • Пользовательская роль "admin" рабочей области с доступом для создания экземпляров вычислений и кластеровA 'workspace admin' custom role with access to create compute instances and clusters
    • Пользовательская роль "Data анализу", которая требует, чтобы все инфраструктуры настроились другим пользователем, прежде чем анализу данных сможет начать работуA 'data scientist' custom role requiring all infrastructure to be set up by another user before the data scientist can begin work

Дальнейшие действияNext steps