Componente: Atribuir Dados aos Clusters

Este artigo descreve como usar o componenteAtribuir Dados aos Clusters no designer do Azure Machine Learning. O componente gera previsões por meio de um modelo de clustering que foi treinado com o algoritmo de clustering K-means.

O componente Atribuir Dados aos Clusters retorna um DataSet que contém as atribuições prováveis para cada novo ponto de dados.

Como usar a atribuição de dados a clusters

  1. No Azure Machine Learning designer, localize um modelo de clustering treinado anteriormente. Você pode criar e treinar um modelo de clustering usando um dos seguintes métodos:

    • Configure o algoritmo de clustering K-means usando o componente de clustering k-means e treine o componente usando um conjunto de um DataSet e o módulo treinar modelo de clustering (este artigo).

    • Você também pode adicionar um modelo de clustering treinado existente do grupo modelos salvos em seu espaço de trabalho.

  2. Anexe o modelo treinado à porta de entrada à esquerda de atribuir dados a clusters.

  3. Anexe um novo conjunto de dados como entrada.

    Nesse conjunto de DataSet, os rótulos são opcionais. Em geral, o clustering é um método de aprendizado não supervisionado. Você não deve conhecer as categorias com antecedência. No entanto, as colunas de entrada devem ser iguais às colunas usadas no treinamento do modelo de clustering ou ocorre um erro.

    Dica

    Para reduzir o número de colunas que são gravadas no designer de previsões de cluster, use selecionar colunas no conjuntode linhas e selecione um subconjunto das colunas.

  4. Deixe a caixa de seleção Marcar para acrescentar ou desmarcar para resultado somente marcada se desejar que os resultados contenham o conjunto de dados de entrada completo, incluindo uma coluna que exibe os resultados (atribuições de cluster).

    Se você desmarcar essa caixa de seleção, somente os resultados serão retornados. Essa opção pode ser útil quando você cria previsões como parte de um serviço Web.

  5. Enviar o pipeline.

Resultados

  • Para exibir os valores nos conjunto de dados, clique com o botão direito do mouse no componente e escolha Visualizar. Ou selecione o componente e alterne para a guia Saídas no painel direito e clique no ícone de histograma nas Saídas da porta para visualizar o resultado.