Client d'exploration de données pour Excel (Compléments d'exploration de données SQL Server)

Le client d'exploration de données pour Excel est un ensemble d'outils qui vous permettent d'effectuer des tâches courantes d'exploration de données, allant du nettoyage des données à la génération de modèle et de requêtes de prédiction. Utilisez les données dans des tableaux ou des plages Excel, ou accédez à des sources de données externes.

DM

  • Utiliser des données

    Chargez vos données dans Excel, nettoyez les données, vérifiez les valeurs hors norme et créez des résumés statistiques. Exécutez également différents genres d'échantillonnage, profil de données et modèles de test en utilisant des données externes. Le client d'exploration de données constitue la meilleure façon de préparer des données à analyser sans scripts complexes ou processus ETL.

  • Générer des modèles et les analyser

    Ces outils fournissent des interfaces de l'Assistant aux algorithmes d'exploration de données connus et testés de manière empirique, y compris le clustering (K-means et EM), l'analyse des associations, l'analyse de séries chronologiques et les arbres de décisions. Les options avancées de modélisation de chaque Assistant vous donnent le choix entre différents algorithmes, tels que Naïve Bayes ou de réseaux neuronaux, et personnaliser le comportement, par exemple la valeur de départ de cluster ou la taille d'échantillonnage initiale.

    Tous les algorithmes d’exploration de données sont hébergés dans un instance d’Analysis Services, ce qui vous donne plus de puissance pour créer des modèles complexes.

  • Tester, interroger et valider les modèles

    Le client d'exploration de données fournit des outils standard de test des modèles, notamment les graphiques de courbes d'élévation et la validation croisée. Les Assistants disponibles facilitent le test de la validité du jeu de données et sa de précision. L'Assistant Requête crée des requêtes pour utiliser les modèles de prédiction et score.

  • Afficher les modèles

    Les graphiques générés par la plupart des outils peuvent être enregistrés directement dans Excel. Utilisez l’outil Browsing Models in Excel (SQL Server Data Mining Add-ins) pour explorer les modèles.

  • Gérer, documenter et déployer

    Le client d'exploration de données pour Excel gère une connexion active au serveur, ce qui vous permet d'enregistrer votre modèle d'exploration de données sur le serveur afin de l'utiliser pour d'autres tests ou pour le déploiement sur un serveur de production pour une meilleure extensibilité.

Utiliser les données

Le groupe Préparation des données contient les Assistants suivants qui vous aident à examiner et à propre données en préparation des tâches d’exploration de données. La plupart des Assistants vous permettent de fractionner les données dans des jeux d'apprentissage et de test.

Explorer des données (Compléments d'exploration de données SQL Server)
Pour générer et stocker les modèles, les compléments prennent en charge ces connexions de données :

  • Connexion à un serveur Analysis Services, pour le stockage et le traitement des modèles.

  • Connexions facultatives à des sources de données externes. Vous pouvez créer votre modèle à l’aide de n’importe quel type de données qui peut être défini en tant que source de données Analysis Services, ou simplement utiliser les données déjà dans Excel.

Explorer des données (Compléments d'exploration de données SQL Server)
L’Assistant Explorer les données vous aide à comprendre le type et la quantité de données dans votre table de données en montrant la distribution et les valeurs des colonnes sélectionnées, une par une.

Exemples de données (Compléments d'exploration de données SQL Server)
La création du type de données correct pour l'apprentissage et le test de vos modèles constitue une part importante de l'exploration de données, mais cette tâche peut être fastidieuse si vous ne disposez pas des outils adéquats. L’Assistant Exemple de données facilite la division des données utilisées pour un modèle en deux groupes, l’un pour générer le modèle et l’autre pour le tester. Utilisez l'échantillonnage aléatoire ou le suréchantillonnage.

Calcul de prédiction (Outils d'analyse de table pour Excel)
L’Assistant Suppression des valeurs hors norme vous offre plusieurs outils pour identifier et gérer correctement les valeurs hors norme. Il montre la distribution des valeurs et la relation des valeurs hors norme avec d'autres données, et vous permet de décider s'il faut supprimer ou modifier des valeurs hors norme.

Calcul de prédiction (Outils d'analyse de table pour Excel)
L’Assistant Réétiquetage vous aide à créer de nouvelles étiquettes pour les données afin de faciliter la compréhension des résultats de l’analyse. Par exemple, vous pouvez renommer une plage de données avec un nom plus descriptif ou vous pouvez choisir une valeur représentative dans la liste.

Générer des modèles et les analyser

Les options de la section Modélisation des données de la barre d’outils vous permettent de dériver des modèles à partir de données ; regrouper des lignes de données en fonction des attributs, ou explorer les associations. Les Assistants de ce ruban d’outil sont basés sur les puissants algorithmes d’exploration de données disponibles dans Analysis Services. Contrairement aux outils similaires proposés par les Outils d'analyse de table pour Excel, ces Assistants vous permettent de personnaliser le comportement de l'algorithme et d'utiliser diverses sources de données.

Assistant Classification (Compléments d'exploration de données pour Excel)
L’Assistant Classification vous aide à créer un modèle de classification basé sur des données existantes dans un tableau Excel, une plage Excel ou une source de données externe. Un modèle de classification extrait des séquences de vos données qui indiquent des similarités et vous aide à faire des prédictions basées sur des groupements de valeurs. Par exemple, un modèle de classification peut être utilisé pour prédire un risque en fonction des caractéristiques des revenus ou des dépenses.

L’Assistant Classification prend en charge l’utilisation de ces algorithmes d’exploration de données Microsoft : algorithme d’arbres de décision, régression logistique, Naïve Bayes, réseaux neuronaux.

Assistant Estimation (Compléments d'exploration de données pour Excel)
L’Assistant Estimation vous aide à créer un modèle d’estimation. Un modèle d'estimation extrait les séquences de données remarquables et les utilise pour prédire des valeurs de type numérique, telles que devise, montant des ventes, date ou heure.

L’Assistant Estimation utilise ces algorithmes d’exploration de données Microsoft : arbres de décision, régression linéaire, régression logistique et réseaux neuronaux.

Analyser les facteurs d'influence clés (Outils d'analyse de table pour Excel)
L'Assistant Cluster vous permet de créer un modèle de clustering. Un modèle de clustering détecte les groupes de lignes qui partagent des caractéristiques communes. Cet Assistant permet d'explorer des séquences dans tous les types de données.

L’Assistant Cluster utilise l’algorithme de clustering Microsoft, qui inclut À la fois K-moyennes et EM.

Assistant Association (Client d'exploration de données pour Excel)
L’Assistant Association vous aide à créer un modèle d’exploration de données à l’aide de l’algorithme Microsoft Association Rules, qui détecte les événements ou les éléments qui se produisent fréquemment. Ces modèles d'association sont particulièrement utiles pour établir des recommandations.

L’Assistant Association utilise l’algorithme Microsoft Association Rules.

Assistant Prévisions (Compléments d'exploration de données pour Excel)
L’Assistant Prévision vous aide à prédire des valeurs dans une série chronologique. En général, les données que vous utilisez dans les prédictions contiennent un certain type de série chronologique, un cachet de date ou un ID de séquence, et vous l'utilisez pour dériver des séquences afin de prévoir des valeurs.

L’Assistant Prévision utilise l’algorithme Microsoft Time Series.

Modélisation avancée (Compléments d'exploration de données pour Excel)
Vous êtes déjà familiarisé avec l'exploration de données ? Vous pouvez utiliser les options de modélisation des données avancées pour créer des structures de données personnalisées et générer des modèles à l’aide de personnalisations non incluses dans les autres outils et assistants.

Tester, interroger et valider les modèles

Utilisez les Assistants de la barre d’outils Précision et validation pour utiliser des tests standard pour valider la précision de vos modèles et pour évaluer la viabilité du jeu de données pour la création de modèles.

Analyser les facteurs d'influence clés (Outils d'analyse de table pour Excel)
Permet d'évaluer les performances d'un modèle d'exploration de données en générant un graphique de courbes d'élévation ou un graphique en nuage de points.

Matrice de classification (Compléments d'exploration de données SQL Server)
Permet d'évaluer les performances d'un modèle de classification en créant un graphique qui synthétise les prédictions précises et imprécises faites par le modèle.

Graphique des bénéfices (Compléments d'exploration de données SQL Server)
Vous permet de comprendre l'impact d'un modèle d'exploration de données en établissant un graphique de l'exactitude des prédictions contenant les coûts et les avantages des actions entreprises basées sur la prédiction.

Validation croisée (Compléments d'exploration de données SQL Server)
Crée un rapport qui résume la précision du modèle par rapport à de nombreux sous-ensemble du jeu de données, afin que vous puissiez déterminer la stabilité du modèle.

Vous pouvez également utiliser les données d'un tableau Excel comme entrée d'une requête de prédiction sur un modèle d'exploration de données stocké sur le serveur.

Requête (Compléments d'exploration de données SQL Server)
L’Assistant Requête vous aide à créer des prédictions sur un modèle d’exploration de données existant.

Éditeur de requêtes d’exploration de données avancée
Pour les utilisateurs expérimentés, cet outil fournit une interface de type glisser-déplacer dans DMX. Créez facilement des requêtes de prédiction ou de nouveaux modèles sans vous préoccuper de la syntaxe.

Afficher les modèles

Les modèles créés automatiquement sont ouverts pour l'exploration. Toutefois, vous pouvez également parcourir les modèles sur le serveur et générer de nouvelles visualisations. Utilisez les formes Visio pour exporter des diagrammes de modèle vers un canevas personnalisable.

Exploration des modèles dans Excel (Compléments d'exploration de données SQL Server)
Affichez les modèles créés à l'aide de graphiques interactifs personnalisés pour chaque type de modèle.

Modèles de documentation de l'exploration de données (Compléments d'exploration de données pour Excel)
Cet Assistant crée des rapports qui fournissent un résumé statistique du jeu de données et des métadonnées relatives au modèle, pour vous aider à effectuer les tâches d'analyse et d'interprétation.

Gérer, documenter et déployer

Ces outils vous aident à établir la connexion à un serveur d'exploration de données, ainsi qu'à gérer et exporter des modèles, et surveiller l'activité d'exploration de données.

Gérer les modèles (Compléments d'exploration de données SQL Server)
Si vous bénéficiez des autorisations nécessaires, vous pouvez supprimer, modifier, renommer ou traiter les structures et modèles d'exploration de données existants sans quitter Excel.

Trace (Client d'exploration de données pour Excel)
Cliquez sur Trace pour afficher une capture continue de l’interaction entre le client Excel et le serveur SQL Server. Toutes les activités sont stockées sous forme d'instructions DMX ou XMLA ; vous pouvez donc résoudre les problèmes de votre session d'exploration de données ou enregistrer les informations en vue de les utiliser ultérieurement.

Connexion à un serveur d'exploration de données
Pour utiliser Excel en tant que client pour l’exploration de données, vous devez établir une connexion à un instance d’Analysis Services. La connexion vous permet d’accéder au moteur Analysis Services. Si vous disposez des autorisations nécessaires, la connexion vous permet également de stocker les séquences que vous avez découvertes et de modifier des objets d'exploration de données existants.

La barre d’outils Connexions fournit des Assistants pour la gestion des connexions à un instance d’Analysis Services. Vous devez définir une connexion à un instance d’Analysis Services pour utiliser les outils et algorithmes d’exploration de données. Vous pouvez créer la connexion lorsque vous installez le complément, ou vous pouvez ajouter une connexion par la suite.

Prise en main
Cliquez sur le bouton Prise en main pour démarrer un Assistant de configuration qui vous guide tout au long du processus de création d’une connexion à un instance d’Analysis Services et d’obtention des autorisations nécessaires pour effectuer l’exploration de données.

Aide
Le menu déroulant Aide fournit des liens vers l’aide en ligne, des sites web et un Assistant de configuration pour vous aider à effectuer la configuration et à démarrer l’exploration de données.

La page d'aide fournit également des liens vers des ressources en ligne, notamment l'aide du complément, et des vidéos, des démonstrations et des exemples supplémentaires.

Voir aussi

Outils d'analyse de table pour Excel
Dépannage des diagrammes d'exploration de données Visio (Compléments d'exploration de données SQL Server)