SystemGetCrossValidationResults (Analysis Services – Data Mining)SystemGetCrossValidationResults (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesPartitioniert die Miningstruktur in die angegebene Anzahl an Querschnitten, trainiert ein Modell für jede Partition, und gibt anschließend genauigkeitsmetriken für jede Partition. Partitions the mining structure into the specified number of cross-sections, trains a model for each partition, and then returns accuracy metrics for each partition.

Hinweis

Die gespeicherte Prozedur kann nicht für die Kreuzvalidierung von Clusteringmodellen oder Modellen verwendet werden, die mithilfe des MicrosoftMicrosoft Time Series-Algorithmus oder des MicrosoftMicrosoft Sequence Clustering-Algorithmus erstellt wurden.This stored procedure cannot be used to cross-validate clustering models, or models that are built by using the MicrosoftMicrosoft Time Series algorithm or the MicrosoftMicrosoft Sequence Clustering algorithm. Zur Kreuzvalidierung von Clusteringmodellen können Sie die gespeicherte Prozedur SystemGetClusterCrossValidationResults (Analysis Services – Data Mining)verwenden.To cross-validate clustering models, you can use the separate stored procedure, SystemGetClusterCrossValidationResults (Analysis Services - Data Mining).

SyntaxSyntax


SystemGetCrossValidationResults(  
<mining structure>  
[, <mining model list>]  
,<fold count>  
,<max cases>  
,<target attribute>  
[,<target state>]  
[,<target threshold>]  
[,<test list>])  

ArgumenteArguments

mining structuremining structure
Name einer Miningstruktur in der aktuellen Datenbank.Name of a mining structure in the current database.

(erforderlich)(required)

mining model listmining model list
Durch Trennzeichen getrennte Liste von Miningmodellen, die überprüft werden sollen.Comma-separated list of mining models to validate.

Wenn ein Modellname Zeichen enthält, die im Namen eines Bezeichners nicht gültig sind, muss der Name in Klammern gesetzt werden.If a model name contains any characters that are not valid in the name of an identifier, the name must be enclosed in brackets.

Wenn keine Liste mit Miningmodellen angegeben wird, erfolgt die Kreuzvalidierung für alle Clustering-Modelle, die mit der angegebenen Struktur verknüpft sind und ein vorhersagbares Attribut enthalten.If a list of mining models is not specified, cross-validation is performed against all models that are associated with the specified structure and that contain a predictable attribute.

Hinweis

Zur Kreuzvalidierung von Clusteringmodellen müssen Sie die gespeicherte Prozedur SystemGetClusterCrossValidationResults (Analysis Services – Data Mining)verwenden.To cross-validate clustering models, you must use a separate stored procedure, SystemGetClusterCrossValidationResults (Analysis Services - Data Mining).

(Optional)(optional)

fold countfold count
Ganzzahliger Wert, der die Anzahl der Partitionen angibt, in die das Dataset aufgeteilt werden soll.Integer that specifies the number of partitions into which to separate the data set. Der Mindestwert beträgt 2.The minimum value is 2. Die maximale Anzahl von Aufteilungen ist maximum integer oder die Anzahl von Fällen, wobei der jeweils niedrigere Wert gilt.The maximum number of folds is maximum integer or the number of cases, whichever is lower.

Jede Partition enthält in etwa diese Anzahl von Fällen: max cases/fold count.Each partition will contain roughly this number of cases: max cases/fold count.

Es gibt keinen Standardwert.There is no default value.

Hinweis

Die Anzahl der Aufteilungen wirkt sich erheblich auf die Zeit aus, die für die Kreuzvalidierung benötigt wird.The number of folds greatly affects the time that is required to perform cross-validation. Wenn Sie eine zu hohe Zahl auswählen, kann die Ausführung der Abfrage sehr lang dauern, und in manchen Fällen reagiert der Server möglicherweise nicht mehr oder ein Timeout tritt ein.If you select a number that is too high, the query might run for a very long time, and in some cases the server can become unresponsive or time out.

(erforderlich)(required)

max casesmax cases
Ganzzahliger Wert, der die maximale Anzahl von Fällen angibt, die über alle Aufteilungen hinweg getestet werden können.Integer that specifies the maximum number of cases that can be tested across all folds.

Der Wert 0 gibt an, dass alle Fälle in der Datenquelle verwendet werden.A value of 0 indicates that all the cases in the data source will be used.

Wenn Sie einen Wert angeben, der größer ist als die tatsächliche Anzahl der Fälle im Dataset ist, werden alle Fälle in der Datenquelle verwendet.If you specify a value that is greater than the actual number of cases in the data set, all cases in the data source will be used.

Es gibt keinen Standardwert.There is no default value.

(erforderlich)(required)

target attributetarget attribute
Zeichenfolge, die den Namen des vorhersagbaren Attributs enthält.String that contains the name of the predictable attribute. Ein vorhersagbares Attribut kann eine Spalte, eine verschachtelte Tabellenspalte oder eine Schlüsselspalte für eine geschachtelte Tabelle eines Miningmodells sein.A predictable attribute can be a column, nested table column, or nested table key column of a mining model.

Hinweis

Das Vorhandensein des Zielattributs wird nur zur Laufzeit überprüft.The existence of the target attribute is validated only at run time.

(erforderlich)(required)

target statetarget state
Formel, die den Wert angibt, der vorhergesagt werden soll.Formula that specifies the value to predict. Wenn ein Zielwert angegeben ist, werden Metriken nur für den angegebenen Wert aufgelistet.If a target value is specified, metrics are collected for the specified value only.

Wenn kein Wert oder nullangegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.If a value is not specified or is null, the metrics are computed for the most probable state for each prediction.

Der Standardwert ist null.The default is null.

Während der Überprüfung wird ein Fehler ausgelöst, wenn der angegebene Wert für das angegebene Attribut nicht gültig ist oder die Formel nicht der richtige Typ für das angegebene Attribut ist.An error is raised during validation if the specified value is not valid for the specified attribute, or if the formula is not the correct type for the specified attribute.

(Optional)(optional)

target thresholdtarget threshold
Double größer als 0 und kleiner als 1.Double greater than 0 and less than 1. Gibt das minimale Wahrscheinlichkeitsergebnis an, das für die Vorhersage des angegebenen Zielstatus erreicht werden muss, damit er als richtig gewertet wird.Indicates the minimum probability score that must be obtained for the prediction of the specified target state to be counted as correct.

Eine Vorhersage, deren Wahrscheinlichkeit niedriger als dieser Wert ist oder damit übereinstimmt, wird als falsch erachtet.A prediction that has a probability less than or equal to this value is considered incorrect.

Wenn kein Wert oder nullangegeben ist, wird der wahrscheinlichste Status unabhängig von seinem Wahrscheinlichkeitsergebnis verwendet.If no value is specified or is null, the most probable state is used, regardless of its probability score.

Der Standardwert ist null.The default is null.

Hinweis

Analysis ServicesAnalysis Serviceswird kein Fehler ausgelöst, wenn Sie festlegen, statusschwellenwert auf 0,0 ist, aber Sie sollten diesen Wert niemals verwenden. will not raise an error if you set state threshold to 0.0, but you should never use this value. Tatsächlich bedeutet eine Schwelle von 0,0, dass Vorhersagen mit einer Wahrscheinlichkeit von 0 (null) Prozent als richtig gewertet werden.In effect, a threshold of 0.0 means that predictions with a 0 percent probability are counted as correct.

(Optional)(optional)

test listtest list
Eine Zeichenfolge, die Testoptionen angibt.A string that specifies testing options.

Hinweis Dieser Parameter ist für die zukünftige Verwendung reserviert.Note This parameter is reserved for future use.

(Optional)(optional)

RückgabetypReturn Type

Das Rowset, das zurückgegeben wird, enthält Bewertungen für jede Partition in jedem Modell.The rowset that is returned contains scores for each partition in each model.

In der folgenden Tabelle werden die Spalten in diesem Rowset beschrieben.The following table describes the columns in the rowset.

SpaltennameColumn Name DescriptionDescription
ModelNameModelName Name des Modells, das getestet wurde.The name of the model that was tested.
AttributeNameAttributeName Der Name der vorhersagbaren Spalte.The name of the predictable column.
AttributeStateAttributeState Ein angegebener Zielwert in der vorhersagbaren Spalte.A specified target value in the predictable column. Wenn dieser Wert nullist, wurde die wahrscheinlichste Vorhersage verwendet.If this value is null, the most probable prediction was used.

Wenn diese Spalte einen Wert enthält, wird die Genauigkeit des Modells nur für diesen Wert bewertet.If this column contains a value, the accuracy of the model is assessed against this value only.
PartitionIndexPartitionIndex Ein 1-basierter Index, der angibt, für welche Partition die Ergebnisse gelten.An 1-based index that identifies to which partition the results apply.
PartitionSizePartitionSize Ein ganzzahliger Wert, der angibt, wie viele Fälle in jeder Partition enthalten waren.An integer that indicates how many cases were included in each partition.
TestTest Kategorie des Tests, der ausgeführt wurde.Category of the test that was performed. Eine Beschreibung der Kategorien und der in jeder Kategorie enthaltenen Tests finden Sie unter Measures im Kreuzvalidierungsbericht.For a description of the categories and the tests that are included in each category, see Measures in the Cross-Validation Report.
MeasureMeasure Der Name des Measures, der vom Test zurückgegeben wurde.The name of the measure returned by the test. Measures für die einzelnen Modelle richten sich nach dem Typ des vorhersagbaren Werts.Measures for each model depend on the type of the predictable value. Definitionen für die einzelnen Measures finden Sie unter Kreuzvalidierung (Analysis Services – Data Mining).For a definition of each measure, see Cross-Validation (Analysis Services - Data Mining).

Eine Liste der für die einzelnen vorhersagbaren Typen zurückgegebenen Measures finden Sie unter Measures im Kreuzvalidierungsbericht.For a list of measures returned for each predictable type, see Measures in the Cross-Validation Report.
valueValue Der Wert des angegebenen Testmeasures.The value of the specified test measure.

RemarksRemarks

Um Genauigkeitsmetriken für das vollständige Dataset zurückzugeben, verwenden Sie SystemGetAccuracyResults (Analysis Services – Data Mining)verwenden.To return accuracy metrics for the complete data set, use SystemGetAccuracyResults (Analysis Services - Data Mining).

Wenn das Miningmodell bereits in Aufteilungen partitioniert wurde, können Sie die Verarbeitung umgehen und nur die Ergebnisse der Kreuzvalidierung zurückgeben, indem Sie SystemGetAccuracyResults (Analysis Services – Data Mining)verwenden.If the mining model has already been partitioned into folds, you can bypass processing and return only the results of cross-validation by using SystemGetAccuracyResults (Analysis Services - Data Mining).

BeispieleExamples

Das folgende Beispiel veranschaulicht, wie man eine Miningstruktur zur Kreuzvalidierung in zwei Aufteilungen partitioniert und dann zwei Miningmodelle testet, die mit der Miningstruktur, [v Target Mail], verknüpft sind.The following example demonstrates how to partition a mining structure for cross-validation into two folds, and then test two mining models that are associated with the mining structure, [v Target Mail].

In Zeile 3 des Codes sind die Miningmodelle aufgelistet, die Sie testen möchten.Line three of the code lists the mining models that you want to test. Wenn Sie die Liste nicht angeben, werden alle der Struktur zugeordneten Nicht-Clusteringmodelle verwendet.If you do not specify the list, all non-clustering models associated with the structure are used. In Zeile 4 des Codes ist die Anzahl der Partitionen angegeben.Line four of the code specifies the number of partitions. Da für max caseskein Wert angegeben ist, werden alle Fälle in der Miningstruktur verwendet und gleichmäßig auf die Partitionen verteilt.Because no value is specified for max cases, all cases in the mining structure are used and distributed evenly across the partitions.

In Zeile 5 ist das vorhersehbare Attribut, Bike Buyer, angegeben, und in Zeile 6 der vorherzusagende Wert, nämlich 1 (was heißt: "Ja, will kaufen").Line five specifies the predictable attribute, Bike Buyer, and line six specifies the value to predict, 1 (meaning "yes, will buy").

Der Wert NULL in Zeile 7 gibt an, dass keine minimale Wahrscheinlichkeitsschwelle erreicht werden muss.The NULL value in line seven indicates that there is no minimum probability bar that must be met. Deshalb wird die erste Vorhersage, die eine Wahrscheinlichkeit von ungleich 0 (null) hat, zur Bewertung der Genauigkeit verwendet.Therefore, the first prediction that has a non-zero probability will be used in assessing accuracy.

CALL SystemGetCrossValidationResults(  
[v Target Mail],  
[Target Mail DT], [Target Mail NB],  
2,  
'Bike Buyer',  
1,  
NULL  
)  

Beispielergebnisse:Sample results:

ModelNameModelName AttributeNameAttributeName AttributeStateAttributeState PartitionIndexPartitionIndex PartitionSizePartitionSize TestTest MeasureMeasure valueValue
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 KlassifizierungClassification Wahr positivTrue Positive 144144
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 KlassifizierungClassification Falsch positivFalse Positive 105105
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 KlassifizierungClassification Wahr negativTrue Negative 186186
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 KlassifizierungClassification Falsch negativFalse Negative 6565
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 WahrscheinlichkeitLikelihood Logarithmisches ErgebnisLog Score -0.619042807138345-0.619042807138345
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 WahrscheinlichkeitLikelihood LiftLift 0.07409637340026710.0740963734002671
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 11 500500 WahrscheinlichkeitLikelihood Wurzel des mittleren quadratischen FehlersRoot Mean Square Error 0.3469462799776530.346946279977653
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 KlassifizierungClassification Wahr positivTrue Positive 162162
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 KlassifizierungClassification Falsch positivFalse Positive 8686
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 KlassifizierungClassification Wahr negativTrue Negative 165165
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 KlassifizierungClassification Falsch negativFalse Negative 8787
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 WahrscheinlichkeitLikelihood Logarithmisches ErgebnisLog Score -0.654117781086519-0.654117781086519
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 WahrscheinlichkeitLikelihood LiftLift 0.0389973991320840.038997399132084
Target Mail DTTarget Mail DT Bike BuyerBike Buyer 11 22 500500 WahrscheinlichkeitLikelihood Wurzel des mittleren quadratischen FehlersRoot Mean Square Error 0.3427213448926510.342721344892651

AnforderungenRequirements

Die Kreuzvalidierung in SQL Server EnterpriseSQL Server Enterprise ist erst ab SQL Server 2008SQL Server 2008verfügbar.Cross-validation is available only in SQL Server EnterpriseSQL Server Enterprise beginning with SQL Server 2008SQL Server 2008.

Weitere Informationen finden Sie unterSee Also

SystemGetCrossValidationResults SystemGetCrossValidationResults
SystemGetAccuracyResults ( Analysis Services – Datamining ) SystemGetAccuracyResults (Analysis Services - Data Mining)
SystemGetClusterCrossValidationResults ( Analysis Services – Datamining ) SystemGetClusterCrossValidationResults (Analysis Services - Data Mining)
SystemGetClusterAccuracyResults (Analysis Services – Data Mining)SystemGetClusterAccuracyResults (Analysis Services - Data Mining)