Como configurar espaços de trabalho do Machine LearningHow to set up machine learning workspaces

Ambientes de Machine Learning e controle de acesso baseado em funçãoMachine learning environments and role-based access control

Ambientes de desenvolvimento, teste e produção dão suporte a processos de operações de aprendizado de máquina.Development, testing, and production environments support machine learning operations processes.

Um diagrama que mostra os ambientes de aprendizado de máquina e o controle de acesso baseado em função.

Em um ambiente de desenvolvimento: Os pipelines do Machine Learning devem dar suporte às atividades de ciência de dados e engenharia realizadas por cientistas de dados e engenheiros de dados.In a development environment: Machine learning pipelines should support the data science and engineering activities carried out by data scientists and data engineers. Eles devem ter permissões totais relacionadas à execução de experimentos, como provisionamento de clusters de treinamento ou criação de modelos.They should have full permissions related to running experiments, such as provisioning training clusters or building models. No entanto, eles não devem ter permissão para atividades como excluir ou criar espaços de trabalho, ou adicionar ou remover usuários do espaço de trabalho.However, they should not have permission for activities like deleting or creating workspaces, or adding or removing workspace users.

Em um ambiente de teste: Vários testes são executados no ambiente do modelo e os testes Champion/rivais ou A/B devem ser usados para o modelo.In a test environment: Various tests are performed on the model's environment, and either champion/challenger or A/B testing should be used for the model. O ambiente de teste deve imitar o ambiente de implantação e deve executar testes como teste de carga, tempo de resposta do modelo e outros.The test environment should mimic the deployment environment, and should run tests such as load testing, model response time, and others. Os cientistas e os engenheiros de dados têm acesso limitado a esse ambiente, principalmente o acesso somente leitura e alguns direitos de configuração.Data scientists and engineers have limited access to this environment, primarily read-only access and some configuration rights. Um engenheiro de DevOps mão tem acesso completo ao ambiente.A DevOps engineer hand has full access to the environment. Automatize o máximo possível de testes.Automate as many tests as possible. Depois que todos os testes forem concluídos, a aprovação do participante será necessária para a implantação no ambiente de produção.Once all the tests are completed, stakeholder approval is required for deployment in the production environment.

Em um ambiente de produção: Um modelo é implantado durante a inferência em lote ou em tempo real.In a production environment: A model is deployed during batch or real-time inference. Um ambiente de produção normalmente é somente leitura; no entanto, um engenheiro de DevOps tem acesso completo a esse ambiente e é responsável por oferecer suporte e manutenção contínuas.A production environment is typically read-only; however, a DevOps engineer has full access to this environment and is responsible for continually supporting and maintaining it. Os cientistas de dados e os engenheiros de dados têm acesso limitado ao ambiente e são somente leitura.Data scientists and data engineers have limited access to the environment, and it's read-only.

O controle de acesso baseado em função para todos os ambientes é mostrado no diagrama a seguir:Role-based access control for all environments is shown in the following diagram:

Um diagrama de controle de acesso baseado em função para todos os ambientes.

Esta tabela mostra que os níveis de acesso do engenheiro de dados e do cientista de dados diminuem em ambientes mais altos, enquanto o acesso do engenheiro de DevOps aumenta.This table shows that the data engineer and data scientist's access levels decrease within higher environments while the DevOps engineer's access increases. Isso ocorre porque um engenheiro de operações do Machine Learning cria o pipeline, cola as coisas e implanta modelos em produção.This is because a machine learning operations engineer builds the pipeline, glues things together, and deploys models in production. Esse nível de granularidade é recomendado para cada função.This level of granularity is recommended for each role.

Fatores que influenciam os espaços de trabalho do Machine LearningFactors that influence machine learning workspaces

Vários fatores podem influenciar como você configura seus espaços de trabalho do Machine Learning e podem ajudá-lo a determinar a melhor estrutura e os controles para cada tipo de espaço de trabalho:Multiple factors can influence how you set up your machine learning workspaces, and they can help you to determine the best structure and controls for each type of workspace:

Um diagrama de como configurar Azure Machine Learning espaços de trabalho.

  • Público, restrito:Public, restricted:

    • Espaço de trabalho de desenvolvimento, teste e produçãoDevelopment, test, and production workspace
    • Função personalizada: cientista de dadosCustom role: Data scientist
    • Integração do git para controle de versão e integração contínua/desenvolvimento contínuo (CI/CD)Git integration for version control and continuous integration/continuous development (CI/CD)
  • Público, sem restrições:Public, unrestricted:

    • Espaço de trabalho de desenvolvimento, teste e produçãoDevelopment, test, and production workspace
    • Função: ColaboradorRole: Contributor
    • Integração do git para controle de versão e CI/CDGit integration for version control and CI/CD
  • Particular, restrito:Private, restricted:

    • Espaço de trabalho de desenvolvimento, teste e produçãoDevelopment, test, and production workspace
    • Link privado habilitadoPrivate Link enabled
    • Função personalizada: cientista de dadosCustom role: Data scientist
    • Integração do git para controle de versão e CI/CDGit integration for version control and CI/CD
  • Privado, irrestrito:Private, unrestricted:

    • Espaço de trabalho de desenvolvimento, teste e produçãoDevelopment, test, and production workspace
    • Link privado habilitadoPrivate Link enabled
    • Função: ColaboradorRole: Contributor
    • Integração do git para controle de versão e CI/CDGit integration for version control and CI/CD
  • Todos os espaços de trabalho:All workspaces:

    • Um espaço de trabalho do Azure Machine Learning Studio por projetoOne Azure Machine Learning studio workspace per project
    • Uma instância de computação por cientista de dadosOne compute instance per data scientist
    • Um cluster de computação por tamanho de máquina virtual compartilhado com cientistas de dados para desenvolvimentoOne compute cluster per virtual machine size shared with data scientists for development
    • Um cluster de computação por pipeline de produçãoOne compute cluster per production pipeline
    • Definindo o tamanho mínimo do nó do cluster de computação como 0 para reduzir os custosSetting the compute cluster minimum node size to 0 to reduce costs
    • Instruindo os usuários a desligar as instâncias de computação manualmente após o usoInstructing users to shut down compute instances manually after use
    • Uma função personalizada de admin do espaço de trabalho com acesso para criar clusters e instâncias de computaçãoA 'workspace admin' custom role with access to create compute instances and clusters
    • Uma função personalizada de ' cientista de dados ' que requer que toda a infraestrutura seja configurada por outro usuário antes que o cientista de dados possa começar a trabalharA 'data scientist' custom role requiring all infrastructure to be set up by another user before the data scientist can begin work

Próximas etapasNext steps