Machine Learning - Treinar

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Este artigo descreve os módulos fornecidos no Machine Learning Studio (clássico) para treinar um modelo de machine learning. O treinamento é o processo de análise de dados de entrada usando os parâmetros de um modelo predefinido. Com essa análise, o modelo aprende os padrões e os salva na forma de um modelo treinado.

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Este artigo também descreve o processo geral no Machine Learning Studio (clássico) para criação, treinamento, avaliação e pontuação do modelo.

Criar e usar modelos de machine learning

O fluxo de trabalho típico para aprendizado de máquina inclui estas fases:

  • Escolher um algoritmo adequado e definir opções iniciais.
  • Treinar o modelo em dados compatíveis.
  • Criando previsões usando novos dados, com base nos padrões no modelo.
  • Avaliar o modelo para determinar se as previsões são precisas, quanto erro há e se há algum sobreajuste.

Machine Learning Studio (clássico) dá suporte a uma estrutura flexível e personalizável para aprendizado de máquina. Cada tarefa nesse processo é executada por um tipo específico de módulo, que pode ser modificado, adicionado ou removido, sem quebrar o restante do experimento.

Os módulos nesta categoria são suportados pelo treinamento para diferentes tipos de modelos. Durante o treinamento, os dados são analisados pelo algoritmo de aprendizado de máquina. Esse algoritmo analisa a distribuição e o tipo dos dados, compila estatísticas e cria padrões que podem ser usados posteriormente para previsão.

Mais sobre o treinamento de modelo

Quando Machine Learning está treinando um modelo, as linhas com valores ausentes são ignoradas. Portanto, se você quiser corrigir os valores manualmente, use a imputação ou especifique um método diferente para lidar com valores ausentes, use o módulo Limpar Dados Ausentes antes do treinamento no conjuntos de dados.

Recomendamos que você use o módulo Editar Metadados para corrigir outros problemas com os dados. Talvez seja necessário marcar a coluna de rótulo, alterar tipos de dados ou corrigir nomes de coluna.

Para outras tarefas comuns de limpeza de dados, como normalização, amostragem, binning e dimensionamento, consulte a categoria Transformação de Dados.

Escolha o treinador certo

O método usado para treinar um modelo depende do tipo de modelo que você está criando e do tipo de dados que o modelo exige. Por exemplo, Machine Learning fornece módulos especificamente para treinar modelos de detecção de anomalias, modelos de recomendação e muito mais.

Verifique a lista de módulos de treinamento para determinar qual deles está correto para seu cenário.

Se você não tiver certeza dos melhores parâmetros a usar ao treinar um modelo, use um dos módulos fornecidos para limpeza e validação de parâmetros:

  • Ajustar hiperparérmetros de modelo pode executar uma varredura de parâmetro em quase todos os modelos de classificação e regressão. Ele treina vários modelos e retorna o melhor modelo.

  • O módulo Clustering de Varredura dá suporte ao ajuste de modelo durante o processo de treinamento e destina-se a ser usado somente com modelos de clustering. Você pode especificar um intervalo de centroides e treinar em dados ao detectar automaticamente os melhores parâmetros.

  • O módulo Modelo de Validação Cruzada também é útil para otimização de modelo, mas não retorna um modelo treinado. Em vez disso, ele fornece métricas que você pode usar para determinar o melhor modelo.

Treinar modelos novamente

Se você precisar treinar um modelo de produção, poderá executar o experimento a qualquer momento.

Você também pode automatizar o processo de retreinamento usando serviços Web. Para ver um passo a passo, confira Treinar e atualizar modelos Machine Learning com Azure Data Factory.

Usar modelos pré-treinado

Machine Learning inclui alguns modelos pré-treinado, como o módulo Classificação de Imagem em Cascata pré-treinado. Você pode usar esses modelos para pontuação sem entrada de dados adicionais.

Além disso, alguns módulos (como Detecção de Anomalias de Séries Temportivas ) não geram um modelo treinado no formato iLearner. Mas eles levam dados de treinamento e criam um modelo internamente, que pode ser usado para fazer previsões. Para usá-los, basta configurar os parâmetros e fornecer dados.

Salvar um instantâneo de um modelo treinado

Se você quiser salvar ou exportar o modelo, clique com o botão direito do mouse no módulo de treinamento e selecione Salvar como Modelo Treinado. O modelo é exportado para o formato iLearner e salvo em seu workspace, em Modelos Treinados. Modelos treinados podem ser rea usados em outros experimentos ou conectados a outros módulos para pontuação.

Você também pode usar o módulo Modelo Treinado de Carga em um experimento para recuperar um modelo armazenado.

Lista de módulos

A categoria Treinar inclui estes módulos:

Alguns módulos não estão nessa categoria, pois exigem um formato especial ou são personalizados para uma tarefa específica:

Confira também