Eseguire il training del modello di clustering

Questo articolo descrive un componente in Azure Machine Learning progettazione.

Usare questo componente per eseguire il training di un modello di clustering.

Il componente accetta un modello di clustering senza training che è già stato configurato usando il componente K-Means Clustering ed è in esecuzione il training del modello usando un set di dati con etichetta o senza etichetta. Il componente crea sia un modello con training che è possibile usare per la stima sia un set di assegnazioni di cluster per ogni case nei dati di training.

Nota

Non è possibile eseguire il training di un modello di clustering usando il componente Train Model, che è il componente generico per il training dei modelli di Machine Learning. Ciò è dovuto al fatto che train model funziona solo con algoritmi di apprendimento supervisionati. K-means e altri algoritmi di clustering consentono l'apprendimento non supervisionato, vale a dire che l'algoritmo può apprendere da dati senza etichetta.

Come usare train clustering model

  1. Aggiungere il componente Train Clustering Model alla pipeline nella finestra di progettazione. È possibile trovare il componente in Machine Learning componenti, nella categoria Training.

  2. Aggiungere il componente K-Means Clustering o un altro componente personalizzato che crea un modello di clustering compatibile e impostare i parametri del modello di clustering.

  3. Collegare un set di dati di training all'input a destra di Train Clustering Model.

  4. In Set di colonne selezionare le colonne del set di dati da usare per la creazione di cluster. Assicurarsi di selezionare le colonne che costituiscono caratteristiche utili, ad esempio evitare di usare ID o altre colonne con valori univoci o colonne con tutti gli stessi valori.

    Se è disponibile un'etichetta, è possibile usarla come funzionalità o omerla.

  5. Selezionare l'opzione Check for append or uncheck for result only(Controlla solo accodamento o deseleziona solo risultato) se si vogliono visualizzare i dati di training insieme alla nuova etichetta del cluster.

    Se si deseleziona questa opzione, vengono restituite solo le assegnazioni di cluster.

  6. Inviare la pipeline oppure fare clic sul componente Train Clustering Model (Esegui modello di clustering) e selezionare Run Selected (Esegui selezionato).

Risultati

Al termine del training:

  • Per salvare uno snapshot del modello con training, selezionare la scheda Output nel pannello destro del componente Train model (Training modello). Selezionare l'icona Registra set di dati per salvare il modello come componente riutilizzabile.

  • Per generare punteggi dal modello, usare Assegna dati ai cluster.

Nota

Se è necessario distribuire il modello con training nella finestra di progettazione, assicurarsi che Assign Data to Clusters (Assegna dati ai cluster) anziché Score Model (Assegna modello) sia connesso all'input del componente Web Service Output (Output servizio Web) nella pipeline di inferenza.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.