O que é um workspace do Azure Machine Learning?

Os workspaces são locais para colaborar com colegas na criação de artefatos de aprendizado de máquina e agrupamento de trabalhos relacionados. Por exemplo, experimentos, trabalhos, conjuntos de dados, modelos, componentes e pontos de extremidade de inferência. Este artigo descreve workspaces, como gerenciar o acesso a eles e como usá-los para organizar seu trabalho.

Pronto para começar? Criar um workspace.

Tarefas executadas em um workspace

Para equipes de aprendizado de máquina, o workspace é um local para organizar seu trabalho. Abaixo estão algumas das tarefas que você pode iniciar em um workspace:

  • Criar trabalhos - os trabalhos são as execuções de treinamento que você usa para criar modelos. Você pode agrupar trabalhos em experimentos para comparar métricas.
  • Criar pipelines - os pipelines são fluxos de trabalho reutilizáveis para treinar e retreinar o seu modelo.
  • Registrar ativos de dados - os ativos de dados auxiliam no gerenciamento dos dados que você usa para treinamento de modelo e criação de pipeline.
  • Registrar modelos - quando tiver um modelo que deseja implantar, crie um modelo registrado.
  • Implantar um modelo - use o modelo registrado e um script de pontuação para implantar um modelo.

Além de agrupar os resultados do aprendizado de máquina, os workspaces também hospedam configurações de recursos:

Organizando workspaces

Para líderes e administradores de equipe de aprendizado de máquina, os workspaces servem como contêineres para gerenciamento de acesso, gerenciamento de custos e isolamento de dados. Abaixo estão algumas dicas para organizar workspaces:

  • Use funções de usuário para gerenciamento de permissões no workspace entre usuários. Por exemplo, um cientista de dados, um engenheiro de aprendizado de máquina ou um administrador.
  • Atribua acesso a grupos de usuários: usando grupos de usuários do Microsoft Entra, você não precisa adicionar usuários individuais a cada workspace e a outros recursos aos quais o mesmo grupo de usuários requer acesso.
  • Criar um workspace por projeto: embora um workspace possa ser usado para vários projetos, a limitação de um projeto por workspace permite gerar relatórios de custos acumulados no nível do projeto. Isso também permite gerenciar configurações como armazenamentos de dados no escopo de cada projeto.
  • Compartilhar recursos do Azure: os workspaces exigem que você crie vários recursos associados. Compartilhe esses recursos entre os workspaces para salvar etapas repetitivas de instalação.
  • Habilitar o autoatendimento: crie e proteja recursos associados como administrador de TI e use funções de usuário para permitir que os cientistas de dados criem workspaces por conta própria.
  • Compartilhar ativos: você pode compartilhar ativos entre os workspaces usando registros do Azure Machine Learning.

Como meu conteúdo é armazenado em um workspace?

O workspace mantém um histórico de todas as execuções de treinamento, com logs, métricas, saída, metadados de linhagem e um instantâneo de seus scripts. Conforme você executa tarefas no Azure Machine Learning, os artefatos são gerados. Seus metadados e dados são armazenados no workspace e em seus recursos associados.

Recursos associados

Ao criar um novo workspace, você precisará trazer outros recursos do Azure para armazenar seus dados. Caso você não os forneça, esses recursos serão criados automaticamente pelo Azure Machine Learning.

  • Conta de Armazenamento do Azure. Armazena artefatos de aprendizado de máquina, como logs de trabalho. Por padrão, essa conta de armazenamento é usada quando você carrega dados no workspace. Os notebooks do Jupyter que são usados com suas instâncias de computação do Azure Machine Learning também são armazenados aqui.

    Importante

    Para usar uma conta de Armazenamento do Azure existente, ela não pode ser do tipo BlobStorage, uma conta premium (Premium_LRS e Premium_GRS) e não pode ter um namespace hierárquico (usado com o Azure Data Lake Storage Gen2). Você pode usar o armazenamento premium ou o namespace hierárquico como armazenamento adicional criando um armazenamento de dados. Não habilite o namespace hierárquico na conta de armazenamento após a atualização para o uso geral v2. Se você trouxer uma conta de armazenamento v1 de uso geral existente, poderá atualizá-la para uso geral v2 após a criação do workspace.

  • Registro de Contêiner do Azure. Armazena contêineres do Docker criados quando você cria ambientes personalizados por meio do Azure Machine Learning. Os cenários que disparam a criação de ambientes personalizados incluem o AutoML quando este implanta modelos e cria de perfil de dados.

    Observação

    Os workspaces podem ser criados sem o Registro de Contêiner do Azure como uma dependência se você não precisar criar contêineres personalizados do Docker. Para ler imagens de contêiner, o Azure Machine Learning também funciona com registros de contêiner externos. O Registro de Contêiner do Azure é provisionado automaticamente ao criar imagens personalizadas do Docker. Use o RBAC do Azure para impedir que contêineres do docker do cliente sejam criados.

    Observação

    Caso a configuração de assinatura exija a adição de marcas aos recursos presentes nela, o ACR (Registro de Contêiner do Azure) criado pelo Azure Machine Learning falhará, pois não é possível definir marcas como ACR.

  • Azure Application Insights. Ajuda você a monitorar e coletar informações de diagnóstico de seus pontos de extremidade de inferência.

    Para obter mais informações, consulte Monitorar pontos de extremidade online.

  • Azure Key Vault. Armazena segredos usados por destinos de computação e outras informações confidenciais necessárias para o workspace.

Criar um workspace

Há várias maneiras de criar um workspace. Para começar, use uma das seguintes opções:

Para automatizar a criação do workspace usando suas configurações de segurança preferidas:

  • Use APIs REST diretamente no ambiente de script, para integração de plataforma ou fluxos de trabalho de MLOps.

Ferramentas para interação e gerenciamento de workspace

Depois que o seu workspace estiver configurado, você poderá interagir com ele das seguintes formas:

As seguintes tarefas de gerenciamento de workspace estão disponíveis em cada interface.

Tarefa de gerenciamento de workspace Portal Estúdio SDK do Python CLI do Azure Código VS
Criar um workspace
Gerenciar o acesso ao workspace
Criar e gerenciar recursos de computação
Criar uma instância de computação

Aviso

Não há suporte para a movimentação do workspace do Azure Machine Learning para outra assinatura nem para a movimentação da assinatura proprietária para um novo locatário. Se você fizer isso, poderá causar erros.

Sub-recursos

Quando você cria clusters de cálculo e instâncias de computação no Azure Machine Learning, sub-recursos são criados.

  • VMs: fornecem poder de computação para instâncias de computação e clusters de cálculo, que você usa para executar trabalhos.
  • Balanceador de Carga: um balanceador de carga de rede é criado para cada instância de computação e cluster de cálculo para gerenciar o tráfego, mesmo que a instância de computação/cluster seja interrompida.
  • Rede Virtual: ajudam na comunicação dos recursos do Azure entre si, com a Internet e com outras redes locais.
  • Largura de banda: encapsula todas as transferências de dados de saída entre regiões.

Próximas etapas

Para saber mais sobre como planejar um espaço de trabalho para os requisitos da sua organização, confira Organizar e configurar o Azure Machine Learning.

Para começar a usar o Azure Machine Learning, confira: