Executar previsões em lote usando o designer do Azure Machine Learning

Neste artigo, você aprenderá a usar o designer para criar um pipeline de previsão do lote. A previsão de lote permite pontuar continuamente conjuntos de dados de grandes volumes sob demanda usando um serviço Web que pode ser disparado de qualquer biblioteca HTTP.

Nestas instruções, você aprenderá a realizar as seguintes tarefas:

  • Criação e publicação de um pipeline de inferência em lote
  • Consumo de um ponto de extremidade de pipeline
  • Gerenciamento de versões do ponto de extremidade

Para saber como configurar serviços de pontuação de lote usando o SDK, consulte o tutorial sobre pontuação em lote de pipeline.

Pré-requisitos

Estas instruções pressupõem que você já tem um pipeline de treinamento. Para obter uma introdução guiada ao designer, conclua a primeira parte do tutorial do designer.

Importante

Se você não vir os elementos gráficos mencionados neste documento, como botões no estúdio ou no designer, talvez você não tenha o nível de permissões certo para o workspace. Entre em contato com seu administrador de assinatura do Azure para verificar se você recebeu o nível de acesso correto. Para obter mais informações, confira Gerenciar usuários e funções.

Criar um pipeline de inferência em lote

O pipeline de treinamento deve ser executado pelo menos uma vez para poder criar um pipeline de inferência.

  1. Vá até a guia Designer em seu workspace.

  2. Selecione o pipeline de treinamento que treina o modelo que você deseja usar para fazer a previsão.

  3. Envie o pipeline.

Enviar o pipeline

Captura de tela que mostra o trabalho de pipeline configurado com a lista suspensa Experimentar e o botão Enviar destacados.

Você verá uma lista de envio à esquerda da tela. Você pode selecionar o link de detalhes do trabalho para acessar a página de detalhes do trabalho e, após a conclusão do trabalho do pipeline de treinamento, criar um pipeline de inferência em lote.

Captura de tela que mostra a lista de trabalhos enviada.

  1. Na página de detalhes do trabalho, acima da tela, selecione a lista suspensa Criar pipeline de inferência. Selecione Pipeline de inferência em lote.

    Observação

    Atualmente, a geração automática do pipeline de inferência funciona apenas para o pipeline de treinamento criado puramente pelos componentes internos do designer.

    Captura de tela da lista suspensa Criar pipeline de inferência com a opção Pipeline de inferência em lote destacada.

    Ele criará um rascunho do pipeline de inferência de lote para você. O rascunho do pipeline de inferência de lote usa o modelo treinado como nó MD- e a transformação como o nó TD- do trabalho do pipeline de treinamento.

    Você também pode modificar esse rascunho de pipeline de inferência para lidar melhor com os dados de entrada para inferência de lote.

    Captura de tela que mostra um rascunho de pipeline de inferência em lote.

Inclusão de um parâmetro do pipeline

Para criar previsões sobre novos dados, conecte-se manualmente a um conjunto de dados diferente nesta exibição de rascunho do pipeline ou crie um parâmetro para o seu conjunto de dados. Parâmetros permitem alterar o comportamento do processo de inferência em lote em tempo de execução.

Nesta seção, você criará um parâmetro de conjunto de dados para especificar um conjunto de dados diferente para o qual serão feitas as previsões.

  1. Selecione o componente de conjunto de dados.

  2. Um painel será exibido à direita da tela. Na parte inferior do painel, selecione Definir como parâmetro de pipeline.

    Insira um nome para o parâmetro ou aceite o valor padrão.

    Captura de tela da guia de conjunto de dados limpa com a opção Definir como parâmetro de pipeline marcada.

  3. Envie o pipeline de inferência de lote e vá para a página de detalhes do trabalho selecionando o link de trabalho no painel esquerdo.

Publicação do pipeline de inferência em lote

Tudo pronto para implantar o pipeline de inferência. Isso implantará o pipeline e o tornará disponível para outras pessoas usarem.

  1. Clique no botão Publicar.

  2. Na caixa de diálogo exibida, expanda a lista suspensa para PipelineEndpoint e selecione Novo PipelineEndpoint.

  3. Forneça um nome e uma descrição opcional para o ponto de extremidade.

    Próximo à parte inferior da caixa de diálogo, você verá o parâmetro configurado com um valor padrão da ID do conjunto de resultados usada durante o treinamento.

  4. Selecione Publicar.

Captura de tela de como configurar um pipeline publicado.

Consumo de um ponto de extremidade

Agora, você publicou um pipeline publicado com um parâmetro de conjunto de dados. O pipeline usará o modelo treinado criado no pipeline de treinamento para pontuar o conjunto de dados que você fornece como um parâmetro.

Enviar um trabalho de pipeline

Nesta seção, você vai configurar um trabalho de pipeline manual e alterar o parâmetro de pipeline para pontuar novos dados.

  1. Após a conclusão da implantação, vá para a seção Pontos de extremidade.

  2. Selecione Pontos de extremidade do pipeline.

  3. Selecione o nome do ponto de extremidade criado.

Captura de tela da guia de ponto de extremidade do pipeline

  1. Selecione Pipelines publicados.

    Esta tela mostra todos os pipelines publicados neste ponto de extremidade.

  2. Selecione o pipeline publicado.

    A página de detalhes do pipeline mostra um histórico de trabalhos detalhado e as informações da cadeia de conexão para o seu pipeline.

  3. Clique no botão Enviar para criar uma execução manual do pipeline.

    Captura de tela de como configurar um trabalho de pipeline com parâmetros destacados.

  4. Altere o parâmetro para usar um conjunto de dados diferente.

  5. Selecione Enviar para executar o pipeline.

Uso do ponto de extremidade de REST

Encontre informações sobre como consumir pontos de extremidade de pipeline e o pipeline publicado na seção Pontos de extremidade.

Encontre o ponto de extremidade de REST de um ponto de extremidade de pipeline no painel de visão geral do trabalho. Quando chama o ponto de extremidade, você consome seu pipeline publicado padrão.

Você também pode consumir um pipeline publicado na página Pipelines publicados. Selecione um pipeline publicado e você poderá encontrar o ponto de extremidade REST dele no painel Visão geral do pipeline publicado à direita do gráfico.

Para realizar uma chamada REST, você precisa de um cabeçalho de autenticação do tipo portador do OAuth 2.0. Confira a seção do tutorial a seguir para obter mais detalhes sobre como configurar a autenticação para seu workspace e realizar uma chamada REST.

Controle de versão dos pontos de extremidade

O designer atribui uma versão a cada pipeline subsequente que você publica em um ponto de extremidade. Especifique a versão do pipeline que deseja executar como um parâmetro em sua chamada REST. Se não especificar um número de versão, o designer usará o pipeline padrão.

Quando publica um pipeline, você pode optar por torná-lo o novo pipeline padrão para esse ponto de extremidade.

Captura de tela de como configurar um pipeline publicado com a opção “Definir pipeline como padrão para este ponto de extremidade” marcada.

Você também pode definir um novo pipeline padrão na guia Pipelines publicados do ponto de extremidade.

Captura de tela da guia de pipeline de exemplo com a opção “Definir como padrão” destacada.

Atualizar o ponto de extremidade do pipeline

Se você fizer algumas modificações no pipeline de treinamento, talvez queira atualizar o modelo recém-treinado para o ponto de extremidade do pipeline.

  1. Depois que o pipeline de treinamento modificado for concluído com êxito, vá para a página de detalhes do trabalho.

  2. Clique com o botão direito do mouse no componente Treinar Modelo e selecione Registrar dados

    Captura de tela das opções de componente de modelo de treinamento com a opção “Registrar dados” destacada.

    Insira o nome e selecione o tipo de Arquivo.

    Captura de tela de Registrar como ativo de dados com a opção “Novo ativo de dados” selecionada.

  3. Localize o rascunho do pipeline de inferência de lote anterior, ou você pode apenas Clonar o pipeline publicado em um novo rascunho.

  4. Substitua o nó MD- no rascunho do pipeline de inferência pelos dados registrados na etapa acima.

    Captura de tela de como atualizar o rascunho de pipeline de inferência com os dados registrados na etapa acima.

  5. Atualizar o nó de transformação de dados TD- é o mesmo que o modelo treinado.

  6. Em seguida, você pode enviar o pipeline de inferência com o modelo e a transformação atualizados e publicar novamente.

Próximas etapas