Partager via


Assistant Cluster (Compléments d'exploration de données pour Excel)

Assistant Cluster dans le ruban Exploration de données

L'Assistant Cluster vous aide à créer un modèle de clustering qui détecte les lignes partageant des caractéristiques similaires et les regroupe pour maximiser la distance entre les groupes. Cet Assistant permet de rechercher des séquences dans tous les types de données.

L'Assistant Cluster utilise l'algorithme de gestion de clusters Microsoft et peut être largement personnalisé. Il fonctionne sur les données existantes d’un tableau Excel, d’une plage Excel ou d’une requête Analysis Services. Des fonctionnalités similaires sont fournies par l’outil Détecter les catégories , fourni dans les outils d’analyse de tableau pour Excel. Toutefois, l'outil Détecter les catégories ne peut pas être personnalisé et doit utiliser les données de tables Excel.

Utilisation de l'Assistant Cluster

  1. Dans le ruban Exploration de données, cliquez sur Cluster, puis sur Suivant.

  2. Dans la page Sélectionner les données sources , sélectionnez un tableau ou une plage Excel. Ou spécifiez une source de données externe.

    Si vous utilisez une source de données externe, vous pouvez créer des vues personnalisées ou coller du texte de requête personnalisé et enregistrer le jeu de données en tant que source de données Analysis Services.

  3. Dans la page Clustering , vous pouvez personnaliser la façon dont le modèle est généré.

    • Pour Nombre de segments, vous pouvez indiquer à l’Assistant de créer un nombre fixe de catégories, ou lui permettre de détecter automatiquement le nombre optimal de regroupements.

    • Passez en revue la liste des colonnes dans la liste Colonnes d’entrée et désélectionnez toutes les colonnes qui ne sont pas utiles pour créer des modèles. Les colonnes à exclure comprennent les numéros d'ID, les noms des clients, etc.

  4. Si vous le souhaitez, cliquez sur Paramètres pour modifier les paramètres de l’algorithme et personnaliser le comportement du modèle clustering.

  5. Dans la page Fractionner les données en jeux d’entraînement et de test , spécifiez la quantité de données à retenir pour le test. Le reste est toujours utilisé pour l'apprentissage du modèle.

    Le paramètre par défaut est 30 % de données de test et 70 % de données de formation.

  6. Dans la page Terminer , fournissez un nom descriptif pour votre jeu de données et votre modèle, puis définissez les options suivantes qui contrôlent la façon dont vous travaillez avec le modèle terminé :

    • Parcourir le modèle. Lorsque cette option est sélectionnée, dès que l’Assistant a terminé de traiter le modèle, une fenêtre Parcourir s’ouvre pour vous aider à explorer les résultats. Le contenu de la visionneuse dépend du type de modèle que vous créez. Pour plus d’informations, consultez Exploration d’un modèle de clustering.

    • Activez l’extraction. Sélectionnez cette option pour examiner les données sous-jacentes du modèle terminé. Cette option est disponible uniquement si vous créez un modèle d'arbre de décision.

    • Utilisez un modèle temporaire. Si cette option est sélectionnée, le modèle ne sera pas enregistré sur le serveur. Lorsque vous fermez Excel, les modèles temporaires sont supprimés.

Pour plus d'informations sur les modèles de clustering

Vous pouvez modifier l’algorithme de clustering utilisé par cet Assistant en cliquant sur Avancé et en utilisant la boîte de dialogue Paramètres de l’algorithme.

L'algorithme de gestion de clusters Microsoft fournit les méthodes de clustering suivantes :

  • K-moyennes : scalable ou non mise à l’échelle.

  • EM (Expectation Maximization) - évolutif ou non évolutif.

Vous pouvez également utiliser le paramètre CLUSTER_SEED pour contrôler la valeur de départ et vous assurer que les modèles répétés utilisant le même jeu de données ont les mêmes résultats.

Configuration requise

Pour utiliser l’Assistant Cluster, vous devez être connecté à une base de données Analysis Services. Pour plus d’informations, consultez Se connecter aux données sources (client d’exploration de données pour Excel).

Voir aussi

Création d'un modèle d'exploration de données
Détecter les catégories (Outils d'analyse de table pour Excel)