Train Clustering Model (Preparar Modelo de Clustering)

Treina um modelo de agrupamento e atribui dados do conjunto de formação a clusters

Categoria: Machine Learning / Train

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como usar o módulo Model clustering de comboios no Azure Machine Learning Studio (clássico), para treinar um modelo de agrupamento.

O módulo requer um modelo de clustering não treinado que já configurado utilizando o módulo de Clustering K-Means, e treina o modelo usando um conjunto de dados rotulado ou não rotulado. O módulo cria tanto um modelo treinado que pode usar para previsão, como um conjunto de atribuições de cluster para cada caso nos dados de treino.

Nota

Um modelo de clustering não pode ser treinado usando o módulo Train Model, que é o módulo genérico para criar modelos de aprendizagem automática. Isto porque o Train Model funciona apenas com algoritmos de aprendizagem supervisionados. K-meios e outros algoritmos de clustering permitem uma aprendizagem não supervisionada, o que significa que o algoritmo pode aprender com dados não rotulados.

Como usar o modelo de clustering do comboio

  1. Adicione o módulo Modelo de Clustering de Comboio à sua experiência em Studio (clássico). Pode encontrar o módulo em Módulos de Aprendizagem automática,na categoria Comboio.

  2. Adicione o módulo de clustering K-Means, ou outro módulo personalizado que cria um modelo de agrupamento compatível, e desa estale os parâmetros do modelo de agrupamento.

  3. Anexar um conjunto de dados de treino à entrada direita do Modelo de Agrupamento de Comboios.

  4. No Conjunto de Colunas, selecione as colunas do conjunto de dados para utilizar em aglomerados de construção. Certifique-se de selecionar colunas que façam boas funcionalidades: por exemplo, evite usar IDs ou outras colunas com valores únicos, ou colunas que tenham todos os mesmos valores.

    Se houver uma etiqueta disponível, pode usá-la como recurso ou deixá-la de fora.

  5. Selecione a opção, Verifique se o Apêndice ou Não Verifique apenas o resultado, se pretender descodificar os dados de formação juntamente com a nova etiqueta do cluster.

    Se desmarcar esta opção, apenas as atribuições de cluster são de saída.

  6. Executar a experiência, ou clicar no módulo Modelo de Clustering de Comboio e selecione Run Selected.

Resultados

Após o treino ter terminado:

  • Para visualizar o cluster e a sua separação num gráfico, clique com o botão certo na saída do conjunto de dados de Resultados e selecione Visualize.

    O gráfico representa os principais componentes do cluster, em vez dos valores reais. Consulte a Análise principal de Componentes para obter mais informações.

  • Para visualizar os valores no conjunto de dados, adicione uma instância do módulo Convertendo-o ao Conjunto de Dados e conecte-o à saída do conjunto de dados de Resultados. Executar o módulo Converter para Conjunto de Dados para obter uma cópia dos dados que pode ver ou descarregar.

  • Para guardar o modelo treinado para posterior reutilização, clique com o botão direito no módulo, selecione Modelo Treinadoe clique em Save As Trained Model.

  • Para gerar pontuações a partir do modelo, utilize atribuir dados a clusters.

Exemplos

Para um exemplo de como o agrupamento é usado na aprendizagem automática, consulte a Galeria Azure AI:

Entradas esperadas

Nome Tipo Descrição
Modelo destreinado Interface ICluster Modelo de agrupamento não treinado
Conjunto de dados Tabela de Dados Fonte de dados de entrada

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Descrição
Conjunto de colunas qualquer Seleção de Colunas Padrão de seleção de colunas
Verifique se o Apêndice ou o Uncheck apenas para resultados qualquer Booleano true Se o conjunto de dados de saída deve conter conjunto de dados de entrada anexado pela coluna de atribuições (Verificado) ou apenas coluna de atribuições (não verificada)

Saídas

Nome Tipo Descrição
Modelo treinado Interface ICluster Modelo de agrupamento treinado
Conjunto de dados de resultados Tabela de Dados Conjunto de dados de entrada anexado por coluna de dados de atribuições ou coluna de atribuições apenas

Exceções

Exceção Descrição
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte códigos de erro de aprendizagem automática.

Para obter uma lista de exceções da API, consulte códigos de erro da API de aprendizagem automática.

Ver também

Lista de Módulos A-Z
Comboio
Atribuir dados a clusters
Clustering K-Means