Treinar Modelo de Clustering

Este artigo descreve o componente no designer do Azure Machine Learning.

Use este componente para treinar um modelo de clustering.

O componente usa um modelo de clustering não treinado que você já configurou usando o componente Clustering K-Means e treina o modelo usando um conjunto de dados com ou sem rótulo. O componente cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.

Observação

Um modelo de clustering não pode ser treinado usando o componente Treinar Modelo, que é o componente genérico para treinar modelos de machine learning. Isso ocorre porque o módulo Treinar Modelo funciona apenas com algoritmos de aprendizado supervisionados. K-means e outros algoritmos de clustering possibilitam o aprendizado não supervisionado, o que significa que o algoritmo pode aprender com dados sem rótulos.

Como usar o módulo Treinar Modelo de Clustering

  1. Adicione o componente Treinar Modelo de Clustering ao pipeline no designer. Você pode encontrar esse componente em Componentes de Machine Learning na categoria Treinar.

  2. Adicione o componente Clustering K-Means, ou outro componente personalizado que cria um modelo de clustering compatível, e defina os parâmetros do modelo de clustering.

  3. Anexe um conjunto de dados de treinamento na entrada à direita do módulo Treinar Modelo de Clustering.

  4. No Conjunto de Colunas, escolha as colunas do conjunto de dados que for usar na criação de clusters. Certifique-se de selecionar as colunas que tenham bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos ou que tenham os mesmos valores.

    Se um rótulo está disponível, você pode usá-lo como um recurso ou deixá-lo de fora.

  5. Selecione a opção marque para acrescentar ou desmarque apenas para o resultado se desejar fazer a saída dos dados de treinamento junto com o novo rótulo de cluster.

    Somente as atribuições de cluster farão a saída se você não selecionar essa opção.

  6. Envie o pipeline ou clique no componente Treinar Modelo de Clustering e selecione Executar Item Selecionado.

Resultados

Após a conclusão do treinamento:

  • Para salvar um instantâneo do modelo treinado, escolha a guia Saídas no painel direito do componente Treinar modelo. Escolha o ícone Registrar conjunto de dados para salvá-lo como um componente reutilizável.

  • Use Atribuir Dados a Clusters para gerar as pontuações do modelo.

Observação

Se você precisar implantar o modelo treinado no designer, certifique-se de que Atribuir Dados a Clusters (e não o Modelo de Pontuação) esteja conectado à entrada do Componente de Saída do Serviço Web no pipeline de inferência.

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.