Composant : attribuer des données à des clusters

Cet article décrit comment utiliser le composant Attribuer des données à des clusters dans le concepteur Azure Machine Learning. Le composant génère des prédictions via un modèle de clustering qui a été formé avec l’algorithme de clustering k-moyennes.

Le composant Attribuer des données à des clusters retourne un jeu de données contenant les attributions probables de chaque nouveau point de données.

Comment utiliser le module Attribuer des données à des clusters

  1. Dans le concepteur Azure Machine Learning, recherchez un modèle de clustering entraîné précédemment. Vous pouvez créer et former un modèle de clustering à l’aide d’une des méthodes suivantes :

    • Configurer l’algorithme de clustering k-moyennes à l’aide du composant Clustering k-moyennes et effectuer l’apprentissage du modèle à l’aide d’un jeu de données et du composant Effectuer l’apprentissage du modèle de clustering (cet article).

    • Vous pouvez également ajouter un modèle de clustering formé existant à partir du groupe Modèles enregistrés dans votre espace de travail.

  2. Attacher le modèle formé au port d’entrée gauche du module Attribuer des données à des clusters.

  3. Attachez un nouveau jeu de données en tant qu’entrée.

    Dans ce jeu de données, les étiquettes sont facultatives. En règle générale, le clustering est une méthode d’apprentissage non supervisée. Vous n’êtes pas censé connaître les catégories en avance. Toutefois, les colonnes d’entrée doivent être identiques aux colonnes utilisées lors de la formation du modèle de clustering. Dans le cas contraire, une erreur se produit.

    Conseil

    Pour réduire le nombre de colonnes rédigées dans le concepteur à partir des prédictions de cluster, utilisez Sélectionner les colonnes dans le jeu de données, puis sélectionnez un sous-ensemble de colonnes.

  4. Cochez la case Cocher pour ajouter ou décocher pour résultats uniquement si vous voulez que les résultats comprennent le jeu de données d’entrée entier, y compris une colonne qui affiche les résultats (attributions de cluster).

    Si vous décochez cette case, seuls les résultats sont retournés. Cette option peut être utile lorsque vous créez des prédictions dans le cadre d’un service web.

  5. Envoyez le pipeline.

Résultats

  • Pour afficher les valeurs dans le jeu de données, cliquez avec le bouton droit sur le composant, puis sélectionnez Visualiser. Vous pouvez aussi sélectionner le composant et basculer vers l’onglet Sorties dans le panneau droit, cliquer sur l’icône d’histogramme dans Sorties de port pour visualiser le résultat.