Treinar Modelo

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Treina um modelo de classificação ou regressão de maneira supervisionada

categoria: Machine Learning/treinar

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

este artigo descreve como usar o módulo treinar modelo no Machine Learning Studio (clássico) para treinar um modelo de classificação ou regressão. O treinamento ocorre depois que você define um modelo e define seus parâmetros e os dados de marcação necessários. Você também pode usar Treinar Modelo para treinar novamente um modelo existente com novos dados.

Como funciona o processo de treinamento

em Machine Learning, criar e usar um modelo de aprendizado de máquina normalmente é um processo de três etapas.

  1. Você configura um modelo escolhendo um tipo específico de algoritmo e definindo seus parâmetros ou hiperparâmetros. Escolha um dos seguintes tipos de modelo:

    • Modelos de classificação, com base em redes neurais, árvores de decisão e florestas de decisão e outros algoritmos.
    • Modelos de regressão, que podem incluir regressão linear padrão ou que usam outros algoritmos, incluindo redes neurais e regressão de baias.
  2. Forneça um conjunto de dados que seja etiquetado e que seja compatível com o algoritmo. Conecte os dados e o modelo a Treinar Modelo.

    O que o treinamento produz é um formato binário específico, o iLearner, que encapsula os padrões estatísticos aprendidos dos dados. Você não pode modificar ou ler este formato diretamente; no entanto, outros módulos no estúdio (clássico) podem usar esse modelo treinado.

    Você também pode exibir as propriedades do modelo. Para obter mais informações, consulte a seção resultados .

  3. Após a conclusão do treinamento, use o modelo treinado com um dos módulos de pontuação para fazer previsões sobre os novos dados.

Observação

Outras tarefas de aprendizado de máquina especializadas exigem diferentes métodos de treinamento, e o estúdio (clássico) fornece módulos de treinamento separados para eles. Por exemplo, detecção de imagem, clustering e anomalias detction todos usam métodos de treinamento personalizados. O modelo de treinamento destina-se ao uso somente com modelos de regressão e classificação.

Treinamento supervisionado e não supervisionado

Você pode ter ouvido conhecer os termos supervisionados ou não supervisionados . Treinar um modelo de classificação ou regressão com o modelo de treinamento é um exemplo clássico de aprendizado de máquina supervisionado. Isso significa que você deve fornecer um conjunto de dados que contenha dado histórico do qual aprender padrões. Os dados devem conter o resultado (rótulo) que você está tentando prever e fatores relacionados (variáveis). O modelo de aprendizado de máquina precisa dos resultados para determinar os recursos que melhor preveem os resultados.

Durante o processo de treinamento, os dados são classificados por resultados e o algoritmo extrai padrões estatísticos para criar o modelo.

O aprendizado não supervisionado indica que o resultado é desconhecido ou você opta por não usar rótulos conhecidos. Por exemplo, os algoritmos de clustering geralmente empregam métodos de aprendizado não supervisionados, mas podem usar rótulos, se disponíveis. Outro exemplo é a modelagem de tópico usando Lda. Você não pode usar o modelo de treinamento com esses algoritmos.

Dica

Novo no Machine Learning? Este tutorial orienta você pelo processo de obtenção de dados, configuração de um algoritmo, treinamento e uso de um modelo: criar seu primeiro experimento de Machine Learning

Como usar o modelo de treinamento

  1. no Machine Learning Studio (clássico), configure um modelo de classificação ou modelos de modelo de regressão .

    Você também pode treinar um modelo personalizado criado usando criar modelo de R.

  2. Adicione o módulo modelo de treinamento ao experimento. Esse módulo pode ser encontrado na categoria Machine Learning. Expanda treinare arraste o módulo modelo de treinamento para seu experimento.

  3. Na entrada à esquerda, anexe o modo não treinado. Anexe o conjunto de dados de treinamento na entrada à direita do módulo Treinar Modelo.

    O conjuntos de dados de treinamento deve conter uma coluna de etiqueta. Todas as linhas sem etiqueta são ignoradas.

  4. Para coluna de rótulo, clique em Iniciar seletor de colunae escolha uma única coluna que contenha resultados que o modelo pode usar para treinamento.

    • Para problemas de classificação, a coluna de etiqueta deve conter valores categóricos ou valores discretos. Alguns exemplos podem ser uma classificação sim/não, um nome ou código de classificação de doença ou um grupo de renda. Se você escolher uma coluna não-categórica, o módulo retornará um erro durante o treinamento.

    • Para problemas de regressão, a coluna de etiqueta deve conter dados numéricos que representam a variável de resposta. O ideal é que os dados numéricos representem uma escala contínua.

    Exemplos podem ser uma pontuação de risco de crédito, o tempo projetado para a falha de um disco rígido ou o número previsto de chamadas para uma central de atendimento em um determinado dia ou hora. Se você não escolher uma coluna numérica, poderá receber um erro.

    • se você não especificar qual coluna de rótulo usar, Machine Learning tentará inferir qual é a coluna de rótulo apropriada, usando os metadados do conjunto de um. Se ele escolher a coluna errada, use o seletor de coluna para corrigir.

    Dica

    Se você tiver problemas ao usar o Seletor de coluna, consulte o artigo Selecionar colunas no conjunto de dados para obter dicas. Ele descreve alguns cenários e dicas comuns para usar as opções WITH RULES e BY NAME.

  5. Execute o experimento. Se você tiver muitos dados, isso pode levar algum tempo.

Resultados

Depois que o modelo for treinado:

  • Para exibir os parâmetros de modelo e os pesos de recursos, clique com o botão direito do mouse na saída e selecione Visualizar.

  • Para usar o modelo em outros experimentos, clique com o botão direito do mouse no modelo e selecione salvar modelo. Digite um nome para o modelo.

    Isso salva o modelo como um instantâneo que não é atualizado por execuções repetidas do experimento.

  • Para usar o modelo na previsão de novos valores, conecte-o ao módulo Modelo de Pontuação, junto com os novos dados de entrada.

Se você precisar treinar um tipo de modelo sem suporte pelo modelo de treinamento, há várias opções:

  • Crie um método de Pontuação personalizado usando o script do R ou use um dos muitos pacotes de Pontuação de R disponíveis.

  • Escreva seu próprio script Python para treinar e pontuar um modelo ou usar uma biblioteca Python existente:

  • Modelos de detecção de anomalias

  • Modelos de recomendação

    • se seu modelo usar o Matchbox recomendado fornecido no Machine Learning, use o módulo de recomendação do Train Matchbox .

    • Se você estiver usando um algoritmo diferente para análise ou recomendação de cesta de compras, use seus métodos de treinamento em script R ou Python.

  • Modelos de clustering

Exemplos

Para obter exemplos de como o módulo modelo de treinamento é usado em experimentos de aprendizado de máquina, consulte esses experimentos na Galeria de ia do Azure:

  • Previsão de Varejo: demonstra como criar, treinar e comparar vários modelos.
  • Previsão de atraso de voo: demonstra como treinar vários modelos de classificação relacionados.

Entradas esperadas

Nome Tipo Descrição
Modelo não treinado Interface ILearner Aprendiz não treinado
Dataset Tabela de Dados Dados de treinamento

Parâmetros do módulo

Nome Intervalo Type Padrão Descrição
Coluna de rótulo any ColumnSelection Selecione a coluna que contém a coluna de rótulo ou de resultado

Saídas

Nome Tipo Descrição
Modelo treinado Interface ILearner Aprendiz treinado

Exceções

Para ver uma lista de todos os erros de módulo, consulte Códigos de erro do módulo.

Exceção Descrição
Erro 0032 Ocorrerá uma exceção se o argumento não for um número.
Erro 0033 Ocorrerá uma exceção se o argumento for infinito.
Erro 0083 Ocorrerá uma exceção se o conjunto de dados usado para treinamento não puder ser usado para o tipo concreto de aprendiz.
Erro 0035 Ocorrerá uma exceção se nenhum recurso for fornecido por um determinado usuário ou item.
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.
Erro 0020 Ocorrerá uma exceção se o número de colunas em alguns dos conjuntos de dados transmitidos para o módulo for muito pequeno.
Erro 0021 Ocorrerá uma exceção se o número de linhas em alguns dos conjuntos de dados passados para o módulo for muito pequeno.
Erro 0013 Ocorrerá uma exceção se passado para aprendiz do módulo tiver um tipo inválido.

Confira também

Avaliar Modelo
Lista de Módulo A-Z