Módulos de aprendizagem automática no Azure Machine Learning Studio (clássico)

O fluxo de trabalho típico para machine learning inclui muitas fases:

  • Identificar um problema para resolver e uma métrica para medir resultados.

  • Encontrar, limpar e preparar dados apropriados.

  • Identificar as melhores características e engenharia de novas funcionalidades.

  • Modelos de construção, avaliação e afinação.

  • Usando modelos para gerar previsões, recomendações e outros resultados.

Os módulos desta secção fornecem ferramentas para as fases finais da aprendizagem automática, nas quais se aplica um algoritmo aos dados para treinar um modelo. Nestas fases finais, também gera pontuações e, em seguida, avalia a precisão e utilidade do modelo.

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Lista de tarefas de machine learning por categoria

Para obter uma descrição detalhada deste fluxo de trabalho experimental, consulte a solução de risco de crédito.

Pré-requisitos

Antes de poder chegar à parte divertida da construção de um modelo, normalmente é necessária muita preparação. Esta secção fornece links para ferramentas no Machine Learning Studio (clássico) que podem ajudá-lo a limpar os seus dados, melhorar a qualidade de entrada e prevenir erros de tempo de execução.

Exploração de dados e qualidade de dados

Certifique-se de que os seus dados são o tipo certo de dados, a quantidade certa e a qualidade certa para o algoritmo que escolheu. Compreenda quantos dados tem e como é distribuído. Existem forasteiros? Como foram gerados, e o que significam? Há algum registo duplicado?

Lidar com valores em falta

Os valores em falta podem afetar os seus resultados de muitas maneiras. Por exemplo, quase todos os métodos estatísticos descartam casos com valores em falta. Por predefinição, a Machine Learning segue estas regras quando encontra linhas com valores em falta:

  • Se os dados utilizados para treinar um modelo utilizadores têm valores em falta, quaisquer linhas com valores em falta são ignoradas.

  • Se os dados utilizados como entrada ao marcar contra um modelo utilizadores têm valores em falta, os valores em falta são utilizados como entradas, mas os nulos são propagados. Isto geralmente significa que um nulo é inserido nos resultados em vez de uma previsão válida.

Certifique-se de verificar os seus dados antes de treinar o seu modelo. Para imputar os valores em falta ou corrigir os seus dados, utilize este módulo:

Selecione funcionalidades e reduza a dimensionalidade

O Machine Learning Studio (clássico) pode ajudá-lo a vasculhar os seus dados para encontrar os atributos mais úteis.

Escolha um algoritmo apropriado

O problema que está a tentar resolver determina tanto a escolha dos dados a utilizar em análise como a escolha de um algoritmo.

Para obter mais informações, consulte Como escolher um algoritmo em Azure Machine Learning.

Exemplos

Por exemplo, a aprendizagem automática em ação, consulte a Galeria Azure AI.

Para obter dicas, e uma passagem de algumas tarefas típicas de pré-preparação de dados, consulte Walkthroughs executando o Processo de Ciência de Dados de Equipa.

Ver também