Share via


Création d'un modèle d'exploration de données

La modélisation des données est l’étape de l’exploration de données dans laquelle vous créez des modèles et des tendances en appliquant des algorithmes aux données. Ultérieurement, utilisez ces séquences pour l'analyse, ou pour faire des prédictions.

Les compléments d'exploration de données pour Office prennent en charge l'exploration de données au moyen d'Assistants qui facilitent la création de modèles. Les Assistants analysent les données, identifient des corrélations, calculent l'importance statistique de toutes les variables et sélectionnent automatiquement le meilleur modèle.

Bien que cette fonctionnalité soit tout aussi puissante que les outils d’exploration de données fournis par SQL Server Analysis Services et SQL Server Data Tools (SSDT), la combinaison d’Assistants et de l’interface Excel familière facilite la création, la modification et l’utilisation de l’exploration de données.

Avancés (Exploration de données)

Les Assistants Avancés vous permettent de créer de nouveaux modèles d’exploration de données, basés sur des données stockées dans Excel, à l’aide de l’un des algorithmes d’exploration de données dans SQL Server Analysis Services.

Créer une structure d’exploration de données

L'Assistant Création d'une structure d'exploration de données vous aide à générer une nouvelle structure d'exploration de données, que vous pouvez utiliser comme base pour plusieurs modèles d'exploration de données. L'Assistant vous permet de mettre de côté une partie des données à utiliser comme un jeu de test, afin que vous puissiez évaluer tous les modèles qui utilisent les mêmes données selon un standard de test cohérent.

Créer une structure d'exploration de données (Compléments d'exploration de données SQL Server)

Ajouter un modèle à une structure

L'Assistant Ajout d'un modèle à une structure vous permet de choisir une structure d'exploration de données existante et de créer un nouveau modèle d'exploration de données pour cette structure. Vous pouvez ajouter plusieurs modèles d'exploration de données à une structure, en modifiant les paramètres ou choisissant des algorithmes d'exploration de données différents et personnaliser la sortie.

Ajouter le modèle à la structure (Compléments d'exploration de données pour Excel)

Analyser les facteurs d'influence clés (Analyse)

Vous choisissez une colonne ou une valeur de sortie d'intérêt, puis l'algorithme analyse les données d'entrée pour identifier les facteurs qui ont le plus d'influence sur la cible. Éventuellement, créez un rapport qui compare deux valeurs quelconques, afin que vous puissiez voir comment les facteurs d'influence changent.

L’outil Analyser les influenceurs clés utilise l’algorithme Microsoft Naïve Bayes.

Analyser les facteurs d'influence clés (Outils d'analyse de table pour Excel)

Association (Exploration de données)

L’Assistant Association génère un modèle d’association qui détecte les associations entre les éléments qui apparaissent dans plusieurs transactions : par exemple, dans l’analyse du panier de marché.

Assistant Association (Client d'exploration de données pour Excel)

Classification (Exploration de données)

L’Assistant Classification génère un modèle de classification qui analyse les facteurs qui ont contribué à un résultat cible. Utilisez plusieurs algorithmes avec cet Assistant, y compris d'arbre de décision, Naive Bayes, et de réseaux neuronaux.

Assistant Classification (Compléments d'exploration de données pour Excel)

Cluster (Exploration de données)

L’Assistant Cluster génère un modèle clustering qui détecte les groupes de lignes qui partagent des caractéristiques similaires. Le clustering (parfois appelé segmentation) est une technique d’apprentissage non supervisée qui est très utile lorsque vous essayez de comprendre des modèles et des regroupements dans de nouvelles données.

L'algorithme de gestion de clusters Microsoft prend en charge le clustering K-means et EM (Expectation maximization)

Assistant Cluster (Compléments d’exploration de données pour Excel).

Détecter les catégories (Analyse)

L’outil Détecter les catégories vous permet d’ajouter n’importe quel jeu de données et d’appliquer des clustering pour rechercher des regroupements de données. Il est utile pour rechercher des similitudes et pour créer des groupes à analyser plus en détail.

L’outil Détecter les catégories utilise l’algorithme de clustering Microsoft.

Détecter les catégories (Outils d'analyse de table pour Excel)

Estimation (Exploration de données)

L'Assistant Estimation crée un modèle d'estimation qui extrait les séquences de données remarquables et les utilise pour prédire des valeurs continues de type numérique, date ou heure. Il utilise l’algorithme Microsoft Decision Trees.

Assistant Estimation (Compléments d'exploration de données pour Excel)

Remplir à partir de l'exemple (Analyse)

L’outil Remplir à partir de l’exemple vous aide à imputer des valeurs manquantes. Vous fournissez des exemples de valeurs manquantes, et l'outil crée des modèles basés sur toutes les données de la table, puis recommande de nouvelles valeurs en fonction des séquences dans les données.

L’outil Fill From Example utilise l’algorithme Microsoft Logistic Regression.

Remplir à partir de l'exemple (Outils d'analyse de table pour Excel)

Prévision (Analyse)

L’outil Prévision prend des données qui changent au fil du temps et prédit les valeurs futures.

L’outil Prévision utilise l’algorithme Microsoft Time Series.

Prévisions (Outils d'analyse de table pour Excel)

Prévision (Exploration de données)

L’Assistant Prévision génère un modèle de prévision qui détecte les modèles dans une série de cellules, puis prévoit des valeurs supplémentaires.

Assistant Prévisions (Compléments d'exploration de données pour Excel)

Mettre en surbrillance les exceptions (Analyse)

L’outil Mettre en surbrillance les exceptions analyse les modèles dans une table de données et recherche les lignes et les valeurs qui ne correspondent pas au modèle. Vous pouvez les examiner et les corriger, puis réexécuter le modèle, ou marquer les valeurs avec un indicateur pour une action ultérieure.

L’outil Mettre en surbrillance les exceptions utilise l’algorithme de clustering Microsoft.

Mettre en surbrillance les exceptions (Outils d'analyse de table pour Excel)

Calcul de prédiction (Analyse)

Cet outil crée un modèle d'analyse des facteurs qui mènent aux résultats, puis prédit un résultat pour toute nouvelle entrée, en fonction de critères dérivés de ces modèles. Il génère également une feuille de calcul interactive pour la prise de décision qui vous permet d'établir le score de nouvelles entrées. Vous pouvez également créer une version imprimée de la feuille de calcul que vous pouvez utiliser hors connexion pour l'établissement du score.

L’outil Calculatrice de prédiction utilise l’algorithme Microsoft Logistic Regression.

Calcul de prédiction (Outils d'analyse de table pour Excel)

Scénario : valeur cible (Analyse)

Dans l’outil Recherche d’objectifs, vous spécifiez une valeur cible et l’outil identifie les facteurs sous-jacents qui doivent changer pour atteindre cette cible. Par exemple, si vous savez que vous devez augmenter la satisfaction des appels de 20 %, demandez au modèle de prédire les facteurs qui doivent changer pour obtenir cet objectif.

L’outil Goal Seek utilise l’algorithme Microsoft Logistic Regression.

details

Scénario Valeur cible (Outils d'analyse de table pour Excel)

Scénario : Scénario (Analyse)

L’outil Analyse de scénarios complète l’outil De recherche d’objectifs. Avec cet outil, vous entrez la valeur que vous souhaitez modifier, puis le modèle prédit si cette modification est suffisante pour obtenir les résultats souhaités. Par exemple, demandez au modèle de déterminer si l'ajout d'un opérateur augmenterait la satisfaction des clients d'un point.

L’outil What-If utilise l’algorithme Microsoft Logistic Regression.

Scénario (Outils d'analyse de table pour Excel)

Analyse du panier d'achat (Analyse)

L’outil Analyse du panier d’achat crée des groupes de produits qui sont fréquemment achetés ensemble, afin d’identifier les modèles qui peuvent être utilisés dans la vente croisée ou la vente incitative. Il génère également des rapports basés sur le prix et le coût de paquets de produits connexes, pour aider à la prise de décision.

Utilisez également cet outil pour les événements qui se produisent fréquemment ensemble, les facteurs conduisant à un diagnostic, ou tout autre ensemble de causes et résultats potentiels.

L’outil Analyse du panier d’achat utilise l’algorithme Microsoft Association.

Analyse du panier d'achat (Outils d'analyse de table pour Excel)

Voir aussi

Exploration et nettoyage des données
Validation des modèles et utilisation des modèles pour la prédiction (compléments d'exploration de données pour Excel)
Déploiement et mise à l'échelle des modèles d'exploration de données (Compléments d'exploration de données pour Excel)