Treinar Modelo de Clustering

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Treinar um modelo em cluster e atribui dados a partir do conjunto de treinamento para clusters

Categoria: Machine Learning/Treinar

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo descreve como usar o módulo Treinar Modelo de Clustering no Machine Learning Studio (clássico) para treinar um modelo de clustering.

O módulo usa um modelo de clustering não treinado que você já configurou usando o módulo de cluster K-means e treina o modelo usando um conjunto de dados com ou sem rótulo. O módulo cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.

Observação

Um modelo de clustering não pode ser treinado usando o módulo Treinar Modelo , que é o módulo genérico para criar modelos de machine learning. Isso ocorre porque o módulo Treinar Modelo funciona apenas com algoritmos de aprendizado supervisionados. K-means e outros algoritmos de clustering possibilitam o aprendizado não supervisionado, o que significa que o algoritmo pode aprender com dados sem rótulos.

Como usar o módulo Treinar Modelo de Clustering

  1. Adicione o módulo Treinar Modelo de Clustering ao seu experimento no Studio (clássico). Você pode encontrar esse módulo em Módulos de Machine Learning, na categoria Treinar.

  2. Adicione o módulo cluster K-means, ou outro módulo personalizado que cria um modelo de clustering compatível, e defina os parâmetros do modelo de clustering.

  3. Anexe um conjunto de dados de treinamento na entrada à direita do módulo Treinar Modelo de Clustering.

  4. No Conjunto de Colunas, escolha as colunas do conjunto de dados que for usar na criação de clusters. Certifique-se de selecionar as colunas que tenham bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos ou que tenham os mesmos valores.

    Se um rótulo está disponível, você pode usá-lo como um recurso ou deixá-lo de fora.

  5. Selecione a opção Verificar Anexar ou Desmarcar Somente Resultado, se você quiser a saída dos dados de treinamento junto com o novo rótulo de cluster.

    Somente as atribuições de cluster farão a saída se você não selecionar essa opção.

  6. Execute o experimento ou clique no módulo Treinar Modelo de Clustering e selecione Executar Selecionado.

Resultados

Após a conclusão do treinamento:

  • Para exibir o cluster e sua separação em um grafo, clique com o botão direito do mouse na saída do conjunto de dados Resultados e selecione Visualizar.

    O grafo representa os componentes principais do cluster, em vez dos valores reais. Consulte Análise de componente principal para obter mais informações.

  • Para exibir os valores no conjuntos de dados, adicione uma instância do módulo Converter em Conjuntos de Dados e conecte-a à saída do conjuntos de dados Resultados. Execute o módulo Converter em Conjuntos de Dados para obter uma cópia dos dados que você pode exibir ou baixar.

  • Para salvar o modelo treinado para uso posterior, clique com o botão direito do mouse no módulo, selecione Modelo treinado e clique em Salvar como Modelo Treinado.

  • Use Atribuir Dados a Clusters para gerar as pontuações do modelo.

Exemplos

Para ver um exemplo de como o clustering é usado no aprendizado de máquina, consulte o Galeria de IA do Azure:

Entradas esperadas

Nome Tipo Descrição
Modelo não treinado Interface ICluster Modelo de clustering não treinado
Dataset Tabela de Dados Fonte de dados de entrada

Parâmetros do módulo

Nome Intervalo Type Padrão Descrição
Conjunto de colunas any ColumnSelection Padrão de seleção de coluna
Marque para anexar ou desmarque para somente resultado any Boolean true Se o conjunto de dados de saída tiver de conter o conjunto de dados de entrada anexado por coluna de atribuições (marcado) ou somente colunas de atribuições (desmarcado)

Saídas

Nome Tipo Descrição
Modelo treinado Interface ICluster Modelo de clustering treinado
Conjunto de dados de resultados Tabela de Dados Conjunto de dados de entrada anexado por coluna de dados de atribuições ou somente coluna de atribuições

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.

Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.

Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Confira também

Lista de Módulo A-Z
Treinamento
Atribuir Dados a Clusters
Cluster K-Means