Entraîner un modèle de clustering

Cet article décrit un composant dans le concepteur Azure Machine Learning.

Utilisez ce composant pour effectuer l’apprentissage d’un modèle de clustering.

Le composant prend un modèle de clustering non formé que vous avez déjà configuré à l’aide du composant Clustering k-moyennes, et effectue l’apprentissage du modèle à l’aide d’un jeu de données étiqueté ou non. Le composant crée un modèle formé que vous pouvez utiliser pour la prédiction, ainsi qu’un ensemble d’affectations de cluster pour chaque cas dans les données d’apprentissage.

Notes

Il est impossible d’effectuer l’apprentissage d’un modèle de clustering à l’aide du composant Effectuer l’apprentissage du modèle qui est le composant générique pour l’apprentissage de modèles Machine Learning. Cela est dû au fait que le module Train Model (Entraîner le modèle) fonctionne uniquement avec les algorithmes d’apprentissage supervisé. L’algorithme de clustering k-moyennes et les autres algorithmes de clustering permettent un apprentissage non supervisé, ce qui signifie que l’algorithme peut apprendre à partir de données sans étiquette.

Entraînement d’un modèle de clustering

  1. Ajoutez le composant Effectuer l’apprentissage du modèle de clustering à votre pipeline dans le concepteur. Vous trouverez ce composant sous Composants Machine Learningdans la catégorie Apprentissage.

  2. Ajoutez le composant Clustering k-moyennes ou un autre composant personnalisé qui crée un modèle de clustering compatible, puis définissez les paramètres du modèle de clustering.

  3. Joignez un jeu de données d’entraînement à l’entrée à droite du module Train Clustering Model (Entraîner un modèle de clustering).

  4. Dans Jeu de colonnes, sélectionnez les colonnes du jeu de données à utiliser lors de la création de clusters. Veillez à sélectionner les colonnes qui constituent de bonnes fonctionnalités : par exemple, évitez d’utiliser les ID ou d’autres colonnes qui ont des valeurs uniques ou des colonnes qui ont toutes les mêmes valeurs.

    Si une étiquette est disponible, vous pouvez l’utiliser comme une fonctionnalité ou l’ignorer.

  5. Sélectionnez l’option Check for Append or Uncheck for Result Only (Cocher pour ajouter ou décocher pour les résultats uniquement) si vous souhaitez exporter les données d’apprentissage avec la nouvelle étiquette de cluster.

    Si vous désélectionnez cette option, seuls les affectations de cluster sont générées.

  6. Envoyez le pipeline ou cliquez sur le composant Effectuer l’apprentissage du modèle de clustering, puis sélectionnez Exécuter la sélection.

Résultats

Une fois l’apprentissage terminé :

  • Pour enregistrer un instantané du modèle entraîné, sélectionnez l’onglet Sorties dans le panneau droit du composant Effectuer l’apprentissage du modèle. Sélectionnez l’icône Inscrire le jeu de données pour enregistrer le modèle en tant que composant réutilisable.

  • Pour générer des scores à partir du modèle, utilisez l’option Attribuer des données à des clusters.

Notes

Si vous devez déployer le modèle formé dans le concepteur, assurez-vous que l’option Attribuer des données à des clusters plutôt que Modèle de score est associée à l’entrée du composant Sortie du service web dans le pipeline d’inférence.

Étapes suivantes

Consultez les composants disponibles pour Azure Machine Learning.