Componente: Assegnare dati ai cluster

Questo articolo descrive come usare il componente Assegna dati ai cluster nella finestra di progettazione di Azure Machine Learning. Il componente genera stime tramite un modello di clustering sottoposto a training con l'algoritmo di clustering K-means .

Il componente Assegna dati ai cluster restituisce un set di dati contenente le assegnazioni probabili per ogni nuovo punto dati.

Come usare Assegna dati ai cluster

  1. Nella finestra di progettazione di Azure Machine Learning individuare un modello di clustering con training precedente. È possibile creare e eseguire il training di un modello di clustering usando uno dei metodi seguenti:

    • Configurare l'algoritmo di clustering K-means usando il componente clustering K-Means e eseguire il training del modello usando un set di dati e il componente Train Clustering Model (questo articolo).

    • È anche possibile aggiungere un modello di clustering con training esistente dal gruppo Modelli salvati nell'area di lavoro.

  2. Collegare il modello sottoposto a training alla porta di input sinistra di Assegna dati ai cluster.

  3. Collegare un nuovo set di dati come input.

    In questo set di dati le etichette sono facoltative. In genere, il clustering è un metodo di apprendimento non eseguito. Non è previsto conoscere in anticipo le categorie. Tuttavia, le colonne di input devono essere uguali alle colonne usate nel training del modello di clustering o si verifica un errore.

    Suggerimento

    Per ridurre il numero di colonne scritte nella finestra di progettazione dalle stime del cluster, usare Selezionare colonne nel set di dati e selezionare un subset delle colonne.

  4. Lasciare selezionata la casella di controllo Controlla accodamento o deselezionata solo per i risultati se si desidera che i risultati contengano il set di dati di input completo, inclusa una colonna che visualizza i risultati (assegnazioni di cluster).

    Se si deseleziona questa casella di controllo, vengono restituiti solo i risultati. Questa opzione potrebbe essere utile quando si creano stime come parte di un servizio Web.

  5. Inviare la pipeline.

Risultati

  • Per visualizzare i valori nel set di dati, fare clic con il pulsante destro del mouse sul componente e quindi selezionare Visualizza. In alternativa, selezionare il componente e passare alla scheda Output nel pannello destro, fare clic sull'icona istogramma negli output della porta per visualizzare il risultato.