Tutorial: Integração do Power BI - Arrastar e largar para criar o modelo preditivo (parte 1 de 2)

Na parte 1 deste tutorial, treina-se e implementa-se um modelo preditivo de aprendizagem automática utilizando o designer de Machine Learning Azure. O designer é uma interface de utilizador de baixo código. Na parte 2, usará o modelo para prever os resultados no Microsoft Power BI.

Neste tutorial:

  • Crie uma instância computacional de aprendizagem automática Azure.
  • Crie um cluster de inferências Azure Machine Learning.
  • Criar um conjunto de dados.
  • Treine um modelo de regressão.
  • Desloque o modelo para um ponto final de pontuação em tempo real.

Existem três formas de criar e implementar o modelo que vai utilizar no Power BI. Este artigo abrange "Opção B: Treinar e implementar modelos utilizando o designer." Esta opção é uma experiência de autoria de baixo código que utiliza a interface do designer.

Mas em vez disso, podias usar uma das outras opções:

Pré-requisitos

Criar cálculo para treinar e pontuar

Nesta secção, cria-se uma instância computacional. Os casos de cálculo são usados para treinar modelos de aprendizagem automática. Também cria um cluster de inferências para hospedar o modelo implantado para pontuação em tempo real.

Inscreva-se no Azure Machine Learning Studio. No menu à esquerda, selecione Compute e, em seguida, New:

Screenshot mostrando como criar uma instância de computação.

Na página de instância de computação Create, selecione um tamanho VM. Para este tutorial, selecione um VM Standard_D11_v2. Em seguida, selecione Seguinte.

Na página Definições, diga o seu caso de computação. Em seguida, selecione Criar.

Dica

Também pode usar a instância computacional para criar e executar cadernos.

O seu estado de caso de computação está agora a criar. A máquina demora cerca de 4 minutos a providenciar.

Enquanto espera, na página Compute, selecione o separador clusters de Inferência. Em seguida, selecione New:

Screenshot mostrando como criar um cluster de inferência.

Na página de cluster de inferência Create, selecione uma região e um tamanho VM. Para este tutorial, selecione um VM Standard_D11_v2. Em seguida, selecione Seguinte.

Na página Configurações configurações de configuração:

  1. Forneça um nome de computação válido.
  2. Selecione Dev-teste como o propósito do cluster. Esta opção cria um único nó para hospedar o modelo implantado.
  3. Selecione Criar.

O seu estado de agrupamento de inferência está agora a criar. O seu único aglomerado de nó leva cerca de 4 minutos a ser acionado.

Criar um conjunto de dados

Neste tutorial, você usa o conjunto de dados diabetes. Este conjunto de dados está disponível em Conjuntos de Dados Azure Open.

Para criar o conjunto de dados, no menu à esquerda, selecione Datasets. Em seguida, selecione Criar conjunto de dados. Veja as seguintes opções:

Screenshot mostrando como criar um novo conjunto de dados.

Selecione A partir de conjuntos de dados abertos. No conjunto de dados Criar a partir da página Open Datasets:

  1. Use a barra de pesquisa para encontrar diabetes.
  2. Selecione Amostra: Diabetes.
  3. Selecione Seguinte.
  4. Diga o nome da diabetes dataset.
  5. Selecione Criar.

Para explorar os dados, selecione o conjunto de dados e, em seguida, selecione Explore:

Screenshot mostrando como explorar um conjunto de dados.

Os dados têm 10 variáveis de entrada de base, tais como idade, sexo, índice de massa corporal, pressão arterial média e seis medições de soro sanguíneo. Também tem uma variável alvo, chamada Y. Esta variável-alvo é uma medida quantitativa da progressão da diabetes um ano após a linha de base.

Crie um modelo de aprendizagem automática usando o designer

Depois de criar o computação e conjuntos de dados, pode utilizar o designer para criar o modelo de aprendizagem automática. No Azure Machine Learning Studio, selecione Designer e, em seguida, Novo pipeline:

Screenshot mostrando como criar um novo oleoduto.

Você vê uma tela em branco e um menu Definições:

Screenshot mostrando como selecionar um alvo de computação.

No menu Definições, escolha Selecionar o alvo do cálculo. Selecione a instância de cálculo que criou anteriormente e, em seguida, selecione Guardar. Mude o nome Draft para algo mais memorável, como o modelo diabetes. Finalmente, insira uma descrição.

Na lista de ativos, expanda os Conjuntos de Dados e localize o conjunto de dados da diabetes. Arraste este componente para a tela:

Screenshot mostrando como arrastar um componente para a tela.

Em seguida, arraste os seguintes componentes para a tela:

  1. Regressão Linear (localizada em algoritmos de aprendizagem automática)
  2. Modelo de trem (localizado em Model Training)

Na sua tela, note os círculos na parte superior e inferior dos componentes. Estes círculos são portos.

Screenshot mostrando as portas em componentes não ligados.

Agora ligue os componentes. Selecione a porta na parte inferior do conjunto de dados da diabetes. Arraste-o para a porta no lado superior direito do componente Train Model. Selecione a porta na parte inferior do componente de regressão linear. Arraste-o para a porta no lado superior esquerdo do componente Train Model.

Escolha a coluna de conjunto de dados para usar como variável de etiqueta (alvo) para prever. Selecione o componente Modelo de Comboio e, em seguida, selecione coluna Editar.

Na caixa de diálogo, selecione Introduza o nome da coluna > Y:

Screenshot mostrando como selecionar uma coluna de etiqueta.

Selecione Guardar. O seu fluxo de trabalho de aprendizagem automática deve ser assim:

Screenshot mostrando componentes ligados.

Selecione Submeter. Em Experiência, selecione Criar novo. Nomeie a experiência e, em seguida, selecione Enviar por isso.

Nota

A primeira corrida da sua experiência deve demorar cerca de 5 minutos. As execuções subsequentes são muito mais rápidas porque os componentes de caches do designer que foram executados para reduzir a latência.

Quando a experiência terminar, vê-se esta vista:

Screenshot mostrando uma execução completa.

Para inspecionar os registos de experiências, selecione Train Model e, em seguida, selecione Outputs + logs.

Implementar o modelo

Para implantar o modelo, na parte superior da tela, selecione Criar o gasoduto de > inferência em tempo real:

Screenshot mostrando onde selecionar um pipeline de inferência em tempo real.

O gasoduto condensa-se apenas nos componentes necessários para marcar o modelo. Quando marcar os dados, não saberá os valores variáveis-alvo. Para que possa remover Y do conjunto de dados.

Para remover Y, adicione uma colunas selecionadas no componente Dataset à tela. Ligue o componente para que o conjunto de dados da diabetes seja a entrada. Os resultados são a saída para o componente Do Modelo de Pontuação:

Screenshot mostrando como remover uma coluna.

Na tela, selecione as Colunas Selecionadas no componente Dataset e, em seguida, selecione Editar Colunas.

Na caixa de diálogo de colunas Select, escolha por nome. Em seguida, certifique-se de que todas as variáveis de entrada são selecionadas, mas o alvo não é selecionado:

Screenshot mostrando como remover as definições da coluna.

Selecione Guardar.

Por fim, selecione o componente 'Modelo de Pontuação' e certifique-se de que as colunas de pontuação do apêndice para a caixa de verificação de saída estão limpas. Para reduzir a latência, as previsões são enviadas de volta sem as entradas.

Screenshot mostrando definições para o componente Do Modelo de Pontuação.

Na parte superior da tela, selecione Enviar por favor.

Depois de executar com sucesso o gasoduto de inferência, pode colocar o modelo no seu cluster de inferências. Selecione Implementar.

Na caixa de diálogo de ponto final de configuração em tempo real, selecione Implementar novo ponto final em tempo real. Diga o nome do meu modelo de diabetes. Selecione a inferência criada anteriormente e, em seguida, selecione Implementar:

Screenshot mostrando as definições do ponto final em tempo real.

Passos seguintes

Neste tutorial, viu como treinar e implementar um modelo de designer. Na parte seguinte, aprende-se a consumir (pontuar) este modelo no Power BI.