SystemGetAccuracyResults (Analysis Services - Exploration de données)

Retourne les mesures de précision de validation croisée d'une structure d'exploration de données et de tous les modèles connexes, à l'exclusion des modèles de clustering.

Cette procédure stockée retourne les mesures du jeu de données dans son ensemble sous forme de partition unique. Pour partitionner le jeu de données en sections croisées et retourner les mesures de chaque partition, utilisez SystemGetCrossValidationResults (Analysis Services - Exploration de données).

Notes

Cette procédure stockée n'est pas prise en charge pour les modèles créés à l'aide de l'algorithme MTS (Microsoft Time Series) ou de l'algorithme MSC (Microsoft Sequence Clustering). Par ailleurs, pour les modèles de clustering, utilisez la procédure stockée distincte, SystemGetClusterAccuracyResults (Analysis Services - Exploration de données).

Syntaxe

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Arguments

  • mining structure
    Nom d'une structure d'exploration de données dans la base de données active.

    (Obligatoire)

  • model list
    Liste séparée par des virgules des modèles à valider.

    La valeur par défaut est null. Tous les modèles applicables sont alors utilisés. Lorsque la valeur par défaut est utilisée, les modèles de clustering sont automatiquement exclus de la liste des candidats au traitement.

    (Facultatif)

  • data set
    Valeur entière indiquant quelle partition de la structure d'exploration de données est utilisée pour le test. Cette valeur est dérivée d'un masque de bits qui représente la somme des valeurs suivantes, où chaque valeur individuelle est facultative :

    Cas d'apprentissage

    0x0001

    Scénarios de test

    0x0002

    Filtre de modèle

    0x0004

    Pour obtenir la liste complète des valeurs possibles, consultez la section Remarques de cette rubrique.

    (obligatoire)

  • target attribute
    Chaîne qui contient le nom d'un objet prévisible. Un objet prévisible peut être une colonne, une colonne de table imbriquée ou une colonne de clé de table imbriquée d'un modèle d'exploration de données.

    (obligatoire)

  • target state
    Chaîne qui contient une valeur spécifique à prédire.

    Si une valeur est spécifiée, les mesures sont collectées pour cet état spécifique.

    Si aucune valeur n'est spécifiée, ou si la valeur null est spécifiée, les mesures sont calculées pour l'état le plus probable pour chaque prédiction.

    La valeur par défaut est null.

    (facultatif)

  • target threshold
    Nombre compris entre 0.0 et 1 qui spécifie la probabilité minimale pour que la valeur de prédiction soit comptabilisée comme correcte.

    La valeur par défaut est null, ce qui signifie que toutes les prédictions sont comptabilisées comme correctes.

    (facultatif)

  • test list
    Chaîne qui spécifie les options de test. Ce paramètre est réservé à un usage futur.

    (facultatif)

Type de valeur renvoyée

L'ensemble de lignes retourné contient des scores pour chaque partition et des agrégats pour tous les modèles.

Le tableau suivant répertorie les colonnes retournées par GetValidationResults.

Nom de colonne

Description

Model

Nom du modèle qui a été testé. All indique que le résultat est un agrégat de tous les modèles.

AttributeName

Nom de la colonne prédictible.

AttributeState

Une valeur cible dans la colonne prédictible.

Si cette colonne contient une valeur, les mesures sont collectées uniquement pour l'état spécifié.

Si cette valeur n'est spécifiée, ou si la valeur null est spécifiée, les mesures sont calculées pour l'état le plus probable pour chaque prédiction.

PartitionIndex

Indique la partition à laquelle le résultat s'applique.

Pour cette procédure, toujours 0.

PartitionCases

Entier qui indique le nombre de lignes dans le cas défini, en fonction du paramètre <data set>.

Test

Type de test qui a été effectué.

Measure

Nom de la mesure retournée par le test. Les mesures de chaque modèle dépendent du type de modèle et du type de valeur prévisible.

Pour obtenir la liste des mesures retournées pour chaque type prévisible, consultez Rapport de validation croisée (Analysis Services - Exploration de données).

Pour obtenir une définition de chaque mesure, consultez Validation croisée (Analysis Services - Exploration de données).

Value

Valeur de la mesure spécifiée.

Notes

Le tableau suivant fournit des exemples des valeurs que vous pouvez utiliser pour spécifier les données de la structure d'exploration de données qui sont utilisées pour la validation croisée. Si vous souhaitez utiliser des scénarios de test pour la validation croisée, la structure d'exploration de données doit déjà contenir un jeu de données de test. Pour plus d'informations sur la définition d'un jeu de données de test lorsque vous créez une structure d'exploration de données, consultez Partitionnement des données en jeux d'apprentissage et jeux de test (Analysis Services – Exploration de données).

Valeur de type entier

Description

1

Seuls les cas d'apprentissage sont utilisés.

2

Seuls les scénarios de test sont utilisés.

3

Les cas d'apprentissage et les scénarios de test sont utilisés.

4

Combinaison incorrecte.

5

Seuls les cas d'apprentissage sont utilisés. Le filtre de modèle est appliqué.

6

Seuls les scénarios de test sont utilisés. Le filtre de modèle est appliqué.

7

Les cas d'apprentissage et les scénarios de test sont utilisés. Le filtre de modèle est appliqué.

Pour plus d'informations sur les scénarios dans lesquels utiliser la validation croisée, consultez Validation des modèles d'exploration de données (Analysis Services - Exploration de données).

Exemples

Cet exemple retourne les mesures de précision d'un modèle d'arbre de décision unique, v Target Mail DT, associé à la structure d'exploration de données vTargetMail. Le code de la ligne quatre indique que les résultats doivent être basés sur les scénarios de test, filtrés pour chaque modèle par le filtre spécifique à ce modèle. [Bike Buyer] spécifie la colonne qui doit être prédite, et le 1 sur la ligne suivante indique que le modèle sera évalué uniquement pour la valeur 1 spécifique, qui signifie « Oui, achètera ».

La dernière ligne du code spécifie que la valeur de seuil d'état est 0,5. Cela signifie que les prédictions dont la probabilité est supérieure à 50 pour cent doivent être comptabilisées comme de « bonnes » prédictions lors du calcul de la précision.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Exemples de résultats :

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Value

v Target Mail DT

Bike Buyer

1

0

1638

Classification

True Positive

605

v Target Mail DT

Bike Buyer

1

0

1638

Classification

False Positive

177

v Target Mail DT

Bike Buyer

1

0

1638

Classification

True Negative

501

v Target Mail DT

Bike Buyer

1

0

1638

Classification

False Negative

355

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Log Score

-0.598454638753028

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Lift

0.0936717116894395

v Target Mail DT

Bike Buyer

1

0

1638

Likelihood

Root Mean Square Error

0.361630800104946

Spécifications

La validation croisée est uniquement disponible dans SQL Server Enterprise depuis SQL Server 2008.