Treinar Modelo de Clustering

Treinar um modelo em cluster e atribui dados a partir do conjunto de treinamento para clusters

Categoria: Machine Learning/treinar

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como usar o módulo treinar modelo de clustering no Azure Machine Learning Studio (clássico) para treinar um modelo de clustering.

O módulo usa um modelo de clustering não treinado que você já configurou usando o módulo de clustering K- means e treina o modelo usando um conjunto de dados rotulado ou sem rótulo. O módulo cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.

Observação

Um modelo de clustering não foi possível ser treinado usando o módulo treinar modelo , que é o módulo genérico para a criação de modelos de aprendizado de máquina. Isso ocorre porque o modelo de treinamento funciona apenas com algoritmos de aprendizado supervisionados. K-means e outros algoritmos de clustering permitem aprendizado não supervisionado, o que significa que o algoritmo pode aprender com dados não rotulados.

Como usar o modelo treinar clustering

  1. Adicione o módulo treinar modelo de clustering ao seu experimento no estúdio (clássico). Você pode encontrar o módulo em módulos Machine Learning, na categoria treinar .

  2. Adicione o módulo de clustering K- means ou outro módulo personalizado que cria um modelo de clustering compatível e defina os parâmetros do modelo de clustering.

  3. Anexe um conjunto de dados de treinamento à entrada à direita do modelo Train clustering.

  4. Em conjunto de colunas, selecione as colunas do conjunto de um para usar na criação de clusters. Certifique-se de selecionar colunas que tenham bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos ou colunas que tenham os mesmos valores.

    Se um rótulo estiver disponível, você poderá usá-lo como um recurso ou deixá-lo fora.

  5. Selecione a opção, marque para acrescentar ou desmarque somente o resultado, se desejar gerar os dados de treinamento junto com o novo rótulo de cluster.

    Se você desmarcar essa opção, somente as atribuições de cluster serão geradas.

  6. Execute o experimento ou clique no módulo treinar modelo de clustering e selecione executar selecionado.

Resultados

Após a conclusão do treinamento:

  • Para exibir o cluster e a separação deles em um grafo, clique com o botão direito do mouse na saída do conjunto de resultados e selecione Visualizar.

    O grafo representa os componentes principais do cluster, em vez dos valores reais. Consulte análise de componente principal para obter mais informações.

  • Para exibir os valores no conjunto de resultados, adicione uma instância do módulo converter em conjunto de módulos e conecte-o à saída do conjunto de resultados do resultado . Execute o módulo converter para DataSet para obter uma cópia dos dados que você pode exibir ou baixar.

  • Para salvar o modelo treinado para reutilização posterior, clique com o botão direito do mouse no módulo, selecione modelo treinado e clique em salvar como modelo treinado.

  • Para gerar pontuações do modelo, use atribuir dados a clusters.

Exemplos

Para obter um exemplo de como o clustering é usado no aprendizado de máquina, consulte o Galeria de ia do Azure:

Entradas esperadas

Nome Tipo Descrição
Modelo não treinado Interface ICluster Modelo de clustering não treinado
Conjunto de dados Tabela de Dados Fonte de dados de entrada

Parâmetros do módulo

Name Intervalo Type Padrão Descrição
Conjunto de colunas any ColumnSelection Padrão de seleção de coluna
Marque para anexar ou desmarque para somente resultado any Boolean true Se o conjunto de dados de saída tiver de conter o conjunto de dados de entrada anexado por coluna de atribuições (marcado) ou somente colunas de atribuições (desmarcado)

Saídas

Nome Tipo Descrição
Modelo treinado Interface ICluster Modelo de clustering treinado
Conjunto de dados de resultados Tabela de Dados Conjunto de dados de entrada anexado por coluna de dados de atribuições ou somente coluna de atribuições

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.

Para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

Para obter uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Consulte também

Lista de módulos a-Z
Trem
Atribuir dados a clusters
Cluster K-Means