Matrice de classification (Compléments d'exploration de données SQL Server)Classification Matrix (SQL Server Data Mining Add-ins)

Bouton matrice de classification, ruban Exploration de donnéesClassification Matrix button, Data Mining ribbon

Utilisez la matrice de classification pour évaluer la précision d'un modèle de prédiction.You can use the classification matrix to assess the accuracy of a model for prediction. Pour créer une matrice de classification, vous exécutez un jeu de données de test dans le modèle, et l'outil matrice de classification compare les valeurs réelles du jeu de test par rapport aux prédictions effectuées par le modèle.To generate a classification matrix, you run a set of testing data through the model, and the classification matrix tool compares the actual values from the testing set against the predictions made by the model. Consultez la matrice pour indiquer, d'un seul coup d'œil, la fréquence à laquelle le modèle est correct, et la fréquence à laquelle les prédictions sont incorrectes.By looking at the matrix, you can tell at a glance how often the model is correct, and how often it predicts wrongly.

Dans ces compléments, utilisez le matrice de Classification Assistant pour sélectionner un modèle, spécifiez les données de test et puis générer une matrice de résultats.In these add-ins, use the Classification Matrix wizard to select a model, specify the testing data, and then generate a results matrix.

Procédure : lire une matrice de classificationHow to Read a Classification Matrix

Supposons que votre objectif est de créer un programme de fidélisation des clients et d'affecter les clients aux catégories appropriées, afin que vous puissiez leur fournir un niveau approprié d'incitation.Let’s assume your objective is to design a customer loyalty program and then assign customers to appropriate categories, so that you can provide them with the appropriate level of incentives. Vous avez implémenté trois niveaux pour le programme de récompense (bronze, argent et or) et les avez divulgué aux clients dans une phase de test.You have implemented three levels for the reward program -- bronze, silver, and gold – and given these out to customers in a trial phase. Vous avez également conçu un modèle qui analyse les clients et prédit les catégories correctes.You have also designed a model that analyzes customers and predicts the correct categories. Maintenant vous allez utiliser la matrice de classification sur les données de test pour déterminer la qualité du modèle est prédire l'offre correcte pour tous les clients.Now you will use the classification matrix on the trial data to determine how good the model was at predicting the correct offer for all customers.

La table de la matrice de classification vous indique combien de clients sont affectés à chaque catégorie selon le modèle, puis compare le résultat au nombre de clients qui se sont réellement inscrits pour chaque niveau de récompense.The table from the classification matrix tells you how many customers would be assigned to each category based on the model, and compares that result to the number of customers who actually signed up for each reward level.

Bronze (réel)Bronze (Actual) Or (réel)Gold (Actual) Argent (réel)Silver (Actual)
BronzeBronze 94.45 %94.45% 15.18 %15.18% 1.70 %1.70%
OrGold 2.72 %2.72% 84.82 %84.82% 0.00%0.00%
ArgentSilver 1.84 %1.84% 0.00%0.00% 93.80 %93.80%
CorrigerCorrect 95.45 %95.45% 84.82 %84.82% 98.30 %98.30%
Mal classéesMisclassified 4.55 %4.55% 15.18 %15.18% 1.70 %1.70%
  • Chaque colonne indique les valeurs réelles dans le jeu de données de test.Each column shows the actual values in the testing dataset.

  • Chaque ligne affiche les valeurs prédites.Each row shows the predicted values.

  • Les valeurs en gras, disposées en diagonale entre le coin supérieur gauche et le coin inférieur droit de la matrice, correspondent au nombre correct dans le modèle.The values in boldface, which run diagonally from the upper-left corner to the lower-right corner of the matrix, give you the picture of what the model got right.

  • Toutes les autres valeurs en dehors de la diagonale représentent des erreurs.All other values outside the diagonal represent errors. Certaines erreurs sont des faux positifs, c'est-à-dire que le modèle a prédit que le client va rejoindre le programme au niveau Or, ce qui est incorrect.Some errors are false positives, meaning the model predicted the customer would join the gold program but was wrong. Selon votre domaine, les faux positifs s'avèrent très coûteux.Depending on your domain, false positives can be very costly.

    D'autres sont des faux négatifs, ce qui signifie que le modèle a prédit que le client ne serait pas intéressé bien qu'il ait rejoint le programme.Others are false negatives, meaning the model predicted the customer would not be interested though he or she did join the program. Là encore, selon le domaine à problème, le coût de l'occasion perdue peut être significatif.Again, depending on the problem domain, this lost opportunity cost might be significant.

Utilisation de l'Assistant Matrice de classificationUsing the Classification Matrix Wizard

  1. Sélectionnez le modèle d'exploration de données sur lequel vous voulez baser les prédictions.Select the mining model on which to base predictions.

  2. Sélectionnez une source de nouvelles données de test, ou utilisez les données de test enregistrées avec la structure.Select a source of new test data, or use testing data that was saved with the structure.

  3. Sélectionnez la colonne pour laquelle vous souhaitez évaluer la précision.Select the column for which you want to assess accuracy. Vous pouvez choisir une seule colonne lorsque vous créez une matrice, mais la colonne peut avoir plusieurs valeurs.You can choose only one column when creating a matrix, but the column can have multiple values.

    Conseil : Il peut être difficile d'interpréter une matrice de classification si votre colonne prédictible possède plusieurs colonnes à comparer.Tip: It can be difficult to interpret a classification matrix if your predictable column has many columns to compare.

    Dans le sélectionner des colonnes à prédire page, vous pouvez également spécifier si vous souhaitez afficher le nombre de valeurs correctes et incorrectes, ou afficher un pourcentage.In the Select Columns to Predict page, you can also specify whether you want to display the count of incorrect and incorrect values, or display a percentage.

  4. Sur la page Sélectionner les données source, indiquez si vous utilisez des données de test externes, ou les données de test enregistrées avec le modèle.On the Select Source Data page, indicate whether you are using external testing data, or the test data saved with the model.

  5. Si vous utilisez des données de test externes, vous devez mapper le modèle aux colonnes d’entrée sur le spécifier une relation page de l’Assistant.If you use external testing data, you need to map the model to the input columns on the Specify Relationship page of the wizard.

    Si vous utilisez le jeu de données de test incorporé, le mappage est effectué automatiquementIf you use the embedded test data set, the mapping is done for you

  6. Cliquez sur Terminer pour exécuter des prédictions sur le modèle et de générer la matrice de classification.Click Finish to run predictions against the model and generate the classification matrix.

    L'Assistant crée un rapport contenant la matrice de classification ainsi que d'autres détails à propos de l'analyse.The wizard creates a report that contains the classification matrix and other details about the analysis. Ce rapport est enregistré en tant que table dans Excel, avec un résumé au-dessus du rapport qui indique combien de cas ont été prédits correctement et le nombre de prédictions incorrectes.This report is saved as a table in Excel, with a summary above the report that indicates how many cases were correctly predicted and how many predictions were wrong.

SpécificationsRequirements

  • Pour créer une matrice de classification, vous devez avoir accès à un modèle existant qui prend en charge les mesures de précision.To create a classification matrix, you must have access to an existing mining model that supports accuracy measurement. Les modèles de prévision et les modèles d'association ne peuvent pas être mesurés à l'aide de cet outil.Forecasting models and association models cannot be measured using this tool.

  • Le modèle que vous mesurez doit prédire une valeur discrète ou qui a déjà été discrétisée.The model that you are measuring needs to predict a value that is either discrete or that has already been discretized.

  • Si vous n'utilisez pas l'option permettant d'enregistrer un jeu de test avec votre structure ou modèle, vous devez obtenir un jeu de données d'entrée qui a le même nombre de colonnes, avec les types de données correspondants, comme ceux utilisés dans le modèle.If you didn’t use the option to save a testing set along with your structure or model, you need to obtain an input data set that has essentially the same number of columns, with matching data types, as those used in the model.

  • Le modèle d'exploration de données et les nouvelles données que vous utilisez à des fins de test doivent contenir au moins une colonne qui peut être prédite, et les colonnes doivent contenir le même type de données.Both the data mining model and the new data that you are using for testing must contain at least one column that can be predicted, and the columns must contain the same kind of data.

Problèmes connusKnown Issues

Dans SQL Server 2012 et SQL Server 2014, la possibilité de mapper le jeu de données de test interne au modèle ne fonctionne pas le matrice de Classification outil.In SQL Server 2012 and SQL Server 2014, the ability to map the internal test data set to the model is not working in the Classification Matrix tool. Toutefois, vous pouvez spécifier un jeu de données externe, puis sélectionner le jeu d'apprentissage comme entrée pour déterminer l'erreur dans le jeu de données d'origine.However, you can specify an external data set, and then select the training set as the input to determine error on the original data set.

Voir aussiSee Also

Validation des modèles et à l’aide de modèles pour la prédiction (les données des compléments d’exploration de données pour Excel) Validating Models and Using Models for Prediction (Data Mining Add-ins for Excel)
Explorer les données (compléments d’exploration de données SQL Server) Explore Data (SQL Server Data Mining Add-ins)
Détecter les catégories (outils d’analyse de Table pour Excel)Detect Categories (Table Analysis Tools for Excel)