Kreuzvalidierung (Analysis Services - Data Mining)Cross-Validation (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesKreuzvalidierung ist ein Standardtool in der Analyse und ist ein wichtiges Feature Sie bei der Entwicklung und Feinabstimmung von Datamining-Modelle unterstützt. Cross-validation is a standard tool in analytics and is an important feature for helping you develop and fine-tune data mining models. Sie verwenden die übergreifende Überprüfung, nachdem Sie eine Miningstruktur und zugehörige Miningmodelle erstellt haben, um die Gültigkeit des Modells sicherzustellen.You use cross-validation after you have created a mining structure and related mining models to ascertain the validity of the model. Die übergreifende Überprüfung verfügt über die folgenden Anwendungen:Cross-validation has the following applications:

  • Überprüfen der Stabilität eines bestimmten MiningmodellsValidating the robustness of a particular mining model.

  • Auswerten von mehreren Modellen von einer einzelnen AnweisungEvaluating multiple models from a single statement.

  • Erstellen von mehreren Modellen und Ermitteln des besten Modells auf Grundlage der StatistikBuilding multiple models and then identifying the best model based on statistics.

    In diesem Abschnitt wird beschrieben, wie die für Data Mining bereitgestellten Kreuzvalidierungsfunktionen verwendet werden und wie die Ergebnisse der Kreuzvalidierung auf Grundlage eines einzelnen Datasets entweder für ein einzelnes Modell oder mehrere Modelle interpretiert werden.This section describes how to use the cross-validation features provided for data mining, and how to interpret the results of cross-validation for either a single model or for multiple models based on a single data set.

Übersicht über den Prozess der KreuzvalidierungOverview of Cross-Validation Process

Die Kreuzvalidierung besteht aus zwei Phasen: Training und Ergebnisgenerierung.Cross-validation consists of two phases, training and result generation. Diese Phasen umfassen die folgenden Schritte:These phases include the following steps:

  • Sie wählen eine Zielminingstruktur aus.You select a target mining structure.

  • Sie legen die zu testenden Modelle fest.You specify the models you want to test. Dieser Schritt ist optional; Sie können auch nur die Miningstruktur testen.This step is optional; you can test just the mining structure as well.

  • Sie geben die Parameter zum Testen der trainierten Modelle an.You specify the parameters for testing the trained models.

    • Das vorhersagbare Attribut, der vorhergesagte Wert und der Genauigkeitsschwellenwert.The predictable attribute, predicted value, and accuracy threshold.

    • Die Anzahl von Aufteilungen, in die die Struktur- oder Modelldaten partitioniert werden sollen.The number of folds into which to partition the structure or model data.

  • Analysis ServicesAnalysis Services erstellt und trainiert so viele Modelle, wie Aufteilungen vorhanden sind. creates and trains as many models as there are folds.

  • Analysis ServicesAnalysis Services gibt einen Satz von Genauigkeitsmetriken für jede Aufteilung in jedem Modell zurück oder für das Dataset als Ganzes. returns a set of accuracy metrics for each fold in each model, or for the data set as a whole.

Konfigurieren der KreuzvalidierungConfiguring Cross-Validation

Sie können anpassen, wie die Kreuzvalidierung arbeitet, die die Anzahl der Querschnitte sowie die getesteten Modelle und die Genauigkeitsleiste für Vorhersagen steuert.You can customize the way that cross-validation works to control the number of cross-sections, the models that are tested, and the accuracy bar for predictions. Wenn Sie die gespeicherten Prozeduren für die Kreuzvalidierung verwenden, können Sie auch das Dataset festlegen, das für die Überprüfung der Modelle verwendet wird.If you use the cross-validation stored procedures, you can also specify the data set that is used for validating the models. Diese Vielzahl der Auswahlmöglichkeiten bedeutet, dass Sie einfach zahlreiche Sätze von unterschiedlichen Ergebnissen erstellen können, die anschließend verglichen und analysiert werden müssen.This wealth of choices means that you can easily produce many sets of different results that must then be compared and analyzed.

Dieser Abschnitt enthält Informationen zur entsprechenden Konfiguration der übergreifenden Überprüfung.This section provides information to help you configure cross-validation appropriately.

Festlegen der Anzahl der PartitionenSetting the Number of Partitions

Wenn Sie die Anzahl von Partitionen festlegen, bestimmen Sie, wie viele temporäre Modelle erstellt werden.When you specify the number of partitions, you determine how many temporary models will be created. Für jede Partition wird ein Querschnitt der Daten für die Verwendung als Testsatz gekennzeichnet, und ein neues Modell wird durch Training der restlichen Daten außerhalb der Partition erstellt.For each partition, a cross-section of the data is flagged for use as the test set, and a new model is created by training on the remaining data not in the partition. Dieser Prozess wird wiederholt, bis Analysis ServicesAnalysis Services die festgelegte Anzahl von Modellen erstellt und getestet hat.This process is repeated until Analysis ServicesAnalysis Services has created and tested the specified number of models. Die Daten, die Sie als verfügbar für die Kreuzvalidierung festgelegt haben, werden gleichmäßig über alle Partitionen verteilt.The data that you specified as being available for cross-validation is distributed evenly among all partitions.

Das Beispiel im Diagramm veranschaulicht die Verwendung der Daten, wenn drei Aufteilungen angegeben werden.The example in the diagram illustrates the usage of data if three folds are specified.

Wie die übergreifende Überprüfung Daten segmentiertHow cross-validation segments data

In dem Szenario in dem Diagramm enthält die Miningstruktur ein Zurückhaltungsdataset, das zu Testzwecken verwendet wird, das Testdataset wurde jedoch noch nicht für die Kreuzvalidierung hinzugefügt.In the scenario in the diagram, the mining structure contains a holdout data set that is used for testing, but the test data set has not been included for cross-validation. Als Ergebnis werden alle Daten in dem Trainingsdataset, d. h. 70 Prozent der Daten in der Miningstruktur, für die Kreuzvalidierung verwendet.As a result, all the data in the training data set, 70 percent of the data in the mining structure, is used for cross-validation. Der Bericht für die Kreuzvalidierung zeigt die Gesamtzahl der in jeder Partition verwendeten Fälle an.The cross-validation report shows the total number of cases used in each partition.

Sie können auch die Anzahl der Daten festlegen, die während der Kreuzvalidierung verwendet werden, indem Sie die Anzahl der insgesamt zu verwendenden Fälle angeben.You can also specify the amount of data that is used during cross-validation, by specifying the number of overall cases to use. Die Fälle werden gleichmäßig über alle Aufteilungen verteilt.The cases are distributed evenly across all folds.

Wenn Miningstrukturen in einer Instanz von SQL Server Analysis ServicesAnalysis Servicesgespeichert sind, ist der maximale Wert, den Sie für die Anzahl der Aufteilungen festlegen können, 256, oder die Anzahl der Fälle, je nachdem, welcher Wert der niedrigere ist.For mining structures stored in an instance of SQL Server Analysis ServicesAnalysis Services, the maximum value that you can set for the number of folds is 256, or the number of cases, whichever is less. Wenn Sie eine Sitzungsminingstruktur verwenden, ist die maximale Anzahl der Aufteilungen 10.If you are using a session mining structure, the maximum number of folds is 10.

Hinweis

Wenn Sie die Anzahl der Aufteilungen erhöhen, verlängert sich auch die für die Ausführung der Kreuzvalidierung erforderliche Zeit entsprechend, da für jede Aufteilung ein Modell erzeugt und getestet werden muss.As you increase the number of folds, the time required to perform cross-validation increases accordingly, because a model must be generated and tested for each fold. Wenn die Anzahl der Aufteilungen zu hoch ist, stellen Sie möglicherweise Leistungsprobleme fest.You may experience performance problems if the number of folds is too high.

Festlegen des GenauigkeitsschwellenwertsSetting the Accuracy Threshold

Mithilfe des Statusschwellenwerts können Sie die Genauigkeitsleiste für Vorhersagen festlegen.The state threshold lets you set the accuracy bar for predictions. Für jeden Fall berechnet das Modell die Wahrscheinlichkeitsvorhersage, d. h. die Wahrscheinlichkeit, dass der vorhergesagte Status korrekt ist.For each case, the model calculates the predict probability, meaning the probability that the predicted state is correct. Wenn die Wahrscheinlichkeitsvorhersage die Genauigkeitsleiste überschreitet, wird die Vorhersage als korrekt gewertet, andernfalls wird die Vorhersage als inkorrekt gewertet.If the predict probability exceeds the accuracy bar, the prediction is counted as correct; if not, the prediction is counted as incorrect. Sie steuern diesen Wert, indem Sie für Statusschwellenwert eine Zahl zwischen 0,0 und 1,0 festlegen. Dabei kennzeichnen Zahlen näher bei 1 ein stärkeres Vertrauen in die Vorhersage, und Zahlen näher bei 0 geben an, dass die Vorhersage eher nicht wahr ist.You control this value by setting State Threshold to a number between 0.0 and 1.0, where numbers closer to 1 indicate a strong level of confidence in the predictions, and numbers closer to 0 indicate that the prediction is less likely to be true. Der Standardwert für den Statusschwellenwert ist NULL, was bedeutet, dass der vorhergesagte Status mit der höchsten Wahrscheinlichkeit als Zielwert betrachtet wird.The default value for state threshold is NULL, which means that the predicted state with the highest probability is considered the target value.

Sie sollten beachten, dass die Einstellung für den Statusschwellenwert auf Measures der Modellgenauigkeit auswirkt.You should be aware that the setting for state threshold affects measures of model accuracy. Angenommen, Sie haben drei Modelle, die Sie testen möchten.For example, assume that you have three models that you want to test. Alle basieren auf der gleichen Miningstruktur, und alle sagen die Spalte vorher [Bike Buyer].All are based on the same mining structure and all predict the column [Bike Buyer]. Sie möchten darüberhinaus den einzelnen Wert 1 vorhersagen, was "ja, kaufen" bedeutet.Moreover, you want to predict a single value of 1, meaning "yes, will buy." Die drei Modelle geben Vorhersagen mit den Vorhersagewahrscheinlichkeiten von 0,05, 0,15 und 0,8 zurück.The three models return predictions with predict probabilities of 0.05, 0.15, and 0.8. Wenn Sie für den Statusschwellenwert 0,10 festgelegt haben, werden zwei der Vorhersagen als korrekt gewertet.If you set the state threshold to 0.10, two of the predictions are counted as correct. Wenn Sie für den Statusschwellenwert 0,5 festgelegt haben, wird nur ein Modell als korrekte Vorhersage gewertet.If you set the state threshold to 0.5, only one model is counted as having returned a correct prediction. Wenn Sie den Standardwert NULL verwenden, wird die wahrscheinlichste Vorhersage als richtig gewertet.If you use the default value, null, the most probable prediction is counted as correct. In diesem Fall würden alle drei Vorhersagen als korrekt gewertet werden.In this case, all three predictions would be counted as correct.

Hinweis

Sie können einen Wert von 0,0 für den Schwellenwert festlegen, doch ist dieser bedeutungslos, da jede Vorhersage als korrekt gewertet wird, selbst solche mit einer Wahrscheinlichkeit von NULL.You can set a value of 0.0 for the threshold, but the value is meaningless, because every prediction will be counted as correct, even those with zero probability. Achten Sie darauf, dass Sie für Statusschwellenwert nicht versehentlich 0,0 festlegen.Be careful not to accidentally set State Threshold to 0.0.

Auswählen von Modellen und Spalten zur ÜberprüfungChoosing Models and Columns to Validate

Wenn Sie die Registerkarte Kreuzvalidierung im Data Mining-Designer verwenden, müssen Sie zunächst aus einer Liste eine vorhersagbare Spalte auswählen.When you use the Cross Validation tab in Data Mining Designer, you must first select the predictable column from a list. Eine einzelne Miningstruktur kann in der Regel mehrere Miningmodelle unterstützen, von denen nicht alle die gleiche vorhersagbare Spalte verwenden.Typically, a mining structure can support many mining models, not all of which use the same predictable column. Wenn Sie die Kreuzvalidierung ausführen, können nur die Modelle in den Bericht aufgenommen werden, die die gleiche vorhersagbare Spalte verwenden.When you run cross-validation, only those models that use the same predictable column can be included in the report.

Um ein vorhersagbares Attribut auszuwählen, klicken Sie auf Zielattribut , und wählen Sie die Spalte aus der Liste aus.To choose a predictable attribute, click Target Attribute and select the column from the list. Wenn das Zielattribut eine geschachtelte Spalte oder eine Spalte in einer geschachtelten Tabelle ist, geben Sie den Namen der geschachtelten Spalte im Format <Name der geschachtelten Tabelle > (Schlüssel).< Geschachtelte Spalte >.If the target attribute is a nested column, or a column in a nested table, you must type the name of the nested column using the format <Nested Table Name>(key).<Nested Column>. Wenn die Spalte der geschachtelten Tabelle die Schlüsselspalte ist, können Sie <Name der geschachtelten Tabelle > (Schlüssel).If the only column used from the nested table is the key column, you can use <Nested Table Name>(key).

Nachdem Sie das vorhersagbare Attribut ausgewählt haben, testet Analysis ServicesAnalysis Services automatisch alle Modelle, die das gleiche vorhersagbare Attribut verwenden.After you select the predictable attribute, Analysis ServicesAnalysis Services automatically tests all models that use the same predictable attribute. Enthält das Zielattribut nach der Auswahl der vorhersagbaren Spalte diskrete Werte, können Sie optional einen vorhergesagten Status eingeben, wenn es einen bestimmten Wert gibt, den Sie vorhersagen möchten.If the target attribute contains discrete values, after you have selected the predictable column, you can optionally type a target state, if there is a specific value that you want to predict.

Die Auswahl des vorhergesagten Status beeinflusst die Measures, die zurückgegeben werden.The selection of the target state affects the measures that are returned. Wenn Sie ein Zielattribut – also einen Spaltenamen – angeben und keinen Wert auswählen, den das Modell vorhersagen soll, wird das Model standardmäßig mit seiner Vorhersage des wahrscheinlichsten Status überprüft.If you specify a target attribute—that is, a column name—and do not pick a specific value that you want the model to predict, by default the model will be evaluated on its prediction of the most probable state.

Wenn Sie die Kreuzvalidierung mit Clustermodellen verwenden, gibt es keine vorhersagbare Spalte. Stattdessen wählen Sie im Listenfeld Zielattribut den Eintrag #Cluster aus der Liste aus.When you use cross-validation with clustering models, there is no predictable column; instead, you select #Cluster from the list in the Target Attribute list box. Nachdem Sie diese Option ausgewählt haben, werden andere Optionen, die für Clusteringmodelle nicht relevant sind, z. B. Zielstatus, deaktiviert.After you have selected this option, other options that are not relevant to clustering models, such as Target State, are disabled. Analysis ServicesAnalysis Services testet dann alle Clusteringmodelle, die der Miningstruktur zugeordnet sind. will then test all clustering models that are associated with the mining structure.

Tools für die KreuzvalidierungTools for Cross-Validation

Sie können die Kreuzvalidierung im Data Mining-Designer verwenden, oder Sie können die Kreuzvalidierung ausführen, indem Sie gespeicherte Prozeduren ausführen.You can use cross-validation from the Data Mining Designer, or you can perform cross-validation by running stored procedures.

Wenn Sie die Data Mining-Designer-Tools verwenden, um die Kreuzvalidierung auszuführen, können Sie das Training und die Parameter der Genauigkeitsergebnisse in einem einzelnen Dialogfeld konfigurieren.If you use the Data Mining Designer tools to perform cross-validation, you can configure the training and accuracy results parameters in a single dialog box. Dies erleichtert die Einrichtung und Anzeige der Ergebnisse.This makes it easier to set up and view results. Sie können die Genauigkeit aller Miningmodelle mit Bezug zu einer einzigen Miningstruktur messen und anschließend sofort die Ergebnisse in einem HTML-Bericht anzeigen.You can measure the accuracy of all mining models that are related to a single mining structure and then immediately view the results in an HTML report. Die gespeicherten Prozeduren bieten jedoch einige Vorteile, z. B. hinzugefügte Anpassungen und die Fähigkeit, ein Skript für den Prozess zu erstellen.However, the stored procedures offer some advantages, such as added customizations and the ability to script the process.

Kreuzvalidierung in Data Mining-DesignerCross-Validation in Data Mining Designer

Sie können die Kreuzvalidierung mit der Registerkarte Kreuzvalidierung der Sicht „Mininggenauigkeitsdiagramm“ entweder in SQL Server Management StudioSQL Server Management Studio oder in SQL Server Development Studio ausführen.You can perform cross-validation by using the Cross-Validation tab of the Mining Accuracy Chart view in either SQL Server Management StudioSQL Server Management Studio or SQL Server Development Studio.

Ein Beispiel zum Erstellen eines Kreuzvalidierungsberichts mithilfe der Benutzeroberfläche finden Sie unter Erstellen von Berichten für Kreuzvalidierung.To see an example of how to create a cross-validation report using the user interface, see Create a Cross-Validation Report.

Gespeicherten Prozeduren für die KreuzvalidierungCross-Validation Stored Procedures

Für erfahrene Benutzer ist die Kreuzvalidierung auch in der Form vollständig parametrisierter gespeicherter Systemprozeduren verfügbar.For advanced users, cross-validation is also available in the form of fully parameterized system stored procedures. Sie können die gespeicherten Prozeduren ausführen, indem Sie eine Verbindung mit einer Instanz von SQL Server Management StudioSQL Server Management Studio, oder eine Anwendung mit verwaltetem Code.You can run the stored procedures by connecting to an instance from SQL Server Management StudioSQL Server Management Studio, or from any managed code application.

Die gespeicherten Prozeduren werden nach Miningmodelltyp gruppiert.The stored procedures are grouped by mining model type. Ein Satz mit gespeicherten Prozeduren funktioniert nur mit Clustermodellen.One set of stored procedures works with clustering models only. Der andere Satz mit gespeicherten Prozeduren funktioniert mit anderen Miningmodellen.The other set of stored procedures works with other mining models.

Für jeden Typ des Miningmodells (gruppiert oder nicht gruppiert) führen die gespeicherten Prozeduren eine Kreuzvalidierung in zwei separaten Phasen aus.For each type of mining model, clustered or non-clustered, the stored procedures perform cross-validation in two separate phases.

Partitionieren von Daten und Generieren von Metriken für PartitionenPartition data and generate metrics for partitions

Für die erste Phase rufen Sie eine gespeicherte Systemprozedur auf, die so viele Partitionen erstellt, wie Sie im Dataset festgelegt haben, und gibt Genauigkeitsergebnisse für jede Partition zurück.For the first phase, you call a system stored procedure that creates as many partitions as you specify within the data set, and returns accuracy results for each partition. Für jede Metrik berechnet Analysis Services anschließend die mittlere und die Standardabweichung für die Partitionen.For each metric, Analysis Services then calculates the mean and standard deviation for the partitions.

Definieren der TestdatenDefining the Testing Data

Wenn Sie die gespeicherten Prozeduren für die Kreuzvalidierung ausführen, die die Genauigkeit berechnen (SystemGetAccuracyResults oder SystemGetClusterAccuracyResults), können Sie die Quelle der Daten festlegen, die während der Kreuzvalidierung für den Test verwendet werden.When you run the cross-validation stored procedures that calculate accuracy (SystemGetAccuracyResults or SystemGetClusterAccuracyResults), you can specify the source of the data that is used for testing during cross-validation. Diese Option ist in der Benutzeroberfläche nicht verfügbar.This option is not available in the user interface.

Sie können eine der folgenden Optionen als Testdatenquelle angeben:You can specify as a testing data source any of the following options:

  • Nur die Trainingsdaten verwendenUse only the training data.

  • Ein vorhandenes Testdataset einschließenInclude an existing testing data set.

  • Nur das Testdataset verwendenUse only the testing data set.

  • Vorhandene Filter auf jedes Modell anwendenApply existing filters to each model.

  • Alle Kombination des Trainingssatzes, Testsatzes und der ModellfilterAny combination of the training set, testing set, and model filters.

    Um eine Testdatenquelle anzugeben, legen Sie einen ganzzahligen Wert für den DataSet -Parameter der gespeicherten Prozedur fest.To specify a testing data source, you provide an integer value for the DataSet parameter of the stored procedure. Eine Liste mit Argumentwerten finden Sie im Abschnitt "Anmerkungen" des relevanten Referenzthemas zur gespeicherten Prozedur.For a list of the argument values, see the Remarks section of the relevant stored procedure reference topic.

    Wenn Sie die Kreuzvalidierung mithilfe des Berichts Kreuzvalidierung im Data Mining-Designer ausführen, können Sie das verwendete Dataset nicht ändern.If you perform cross-validation by using the Cross-Validation report in the Data Mining Designer, you cannot change the data set that is used. Standardmäßig werden die Trainingsfälle für jedes Modell verwendet.By default, the training cases for each model are used. Wenn einem Modell ein Filter zugeordnet ist, wird der Filter angewendet.If a filter is associated with a model, the filter is applied.

Ergebnisse der KreuzvalidierungResults of Cross-Validation

Wenn Sie den Data Mining-Designer verwenden, werden diese Ergebnisse in einem rasterähnlichen Web-Viewer angezeigt.If you use the Data Mining Designer, these results are displayed in a grid-like Web viewer. Wenn Sie die gespeicherten Prozeduren für die Kreuzvalidierung verwenden, werden diese gleichen Ergebnisse als Tabelle zurückgegeben.If you use the cross-validation stored procedures, these same results are returned as a table.

Der Bericht enthält zwei Typen von Measures: Aggregate, die die Variabilität des Datasets angeben, wenn Aufteilungen vorhanden sind, und modellspezifische Measures der Genauigkeit für jede Aufteilung.The report contains two types of measures: aggregates that indicate the variability of the data set when divided into folds, and model-specific measures of accuracy for each fold. Die folgenden Themen stellen weitere Informationen zu diesen Metriken bereit:The following topics provide more information about these metrics:

KreuzvalidierungsformelnCross-Validation Formulas

Führt alle Measures nach Testtyp auf.Lists all the measures by test type. Beschreibt im Allgemeinen, wie die Measures interpretiert werden können.Describes in general how the measures can be interpreted.

Measures im KreuzvalidierungsberichtMeasures in the Cross-Validation Report

Beschreibt die Formeln zum Berechnen jedes Measures und listet den Attributtyp auf, der für jedes Measure übernommen werden kann.Describes the formulas for calculating each measure, and lists the type of attribute that each measure can be applied to.

Einschränkungen in Bezug auf die KreuzvalidierungRestrictions on Cross-Validation

Wenn Sie die Kreuzvalidierung mithilfe des Kreuzvalidierungsberichts in SQL Server Development Studio ausführen, gelten für die Modelle, die Sie testen können, sowie für die festzulegenden Parameter einige Einschränkungen.If you perform cross-validation by using the cross-validation report in SQL Server Development Studio, there are some limitations on the models that you can test and the parameters you can set.

  • Standardmäßig werden alle mit der ausgewählten Miningstruktur verbundenen Modelle per Kreuzvalidierung überprüft.By default, all models associated with the selected mining structure are cross-validated. Sie können weder das Modell noch eine Liste von Modellen angeben.You cannot specify the model or a list of models.

  • Die Kreuzvalidierung wird bei Modellen nicht unterstützt, die auf dem Microsoft Time Series-Algorithmus oder dem Microsoft Sequence Clustering-Algorithmus basieren.Cross-validation is not supported for models that are based on the Microsoft Time Series algorithm or the Microsoft Sequence Clustering algorithm.

  • Der Bericht kann nicht erstellt werden, wenn Ihre Miningstruktur keine Modelle enthält, die per Kreuzvalidierung überprüft werden können.The report cannot be created if your mining structure does not contain any models that can be tested by cross-validation.

  • Wenn die Miningstruktur sowohl Cluster- als auch Nicht-Clustermodelle enthält, und Sie die Option #Cluster nicht ausgewählt haben, werden die Ergebnisse für beide Modelltypen im gleichen Bericht angezeigt, auch wenn die Attribut-, Status- und Schwellenwerteinstellungen für die Clustermodelle möglicherweise nicht passen.If the mining structure contains both clustering and non-clustering models and you do not choose the #Cluster option, results for both types of models are displayed in the same report, even though the attribute, state, and threshold settings might not be appropriate for the clustering models.

  • Für die Werte einiger Parameter gelten Einschränkungen.Some parameter values are restricted. Beispielsweise wird eine Warnung angezeigt, wenn die Anzahl der Aufteilungen den Wert 10 überschreitet, denn die Generierung so vieler Modelle könnte dazu führen, dass der Bericht sehr langsam angezeigt wird.For example, a warning is displayed if the number of folds is more than 10, because generating so many models might cause the report to display slowly.

    Wenn Sie mehrere Miningmodelle testen und die Modelle Filter enthalten, wird jedes Modell getrennt gefiltert.If you are testing multiple mining models, and the models have filters, each model is filtered separately. Sie können während der übergreifenden Überprüfung einem Modell keinen Filter hinzufügen oder den Filter für ein Modell ändern.You cannot add a filter to a model or change the filter for a model during cross-validation.

    Da die Kreuzvalidierung standardmäßig alle einer Struktur zugeordneten Miningmodelle testet, erhalten Sie möglicherweise inkonsistente Ergebnisse, wenn einige Modelle einen Filter enthalten und andere nicht.Because cross-validation by defaults tests all mining models that are associated with a structure, you may receive inconsistent results if some models have a filter and others do not. Um sicherzustellen, dass Sie nur solche Modelle vergleichen, die den gleichen Filter enthalten, sollten Sie die gespeicherten Prozeduren verwenden und eine Liste von Miningmodellen festlegen.To ensure that you compare only those models that have the same filter, you should use the stored procedures and specify a list of mining models. Oder verwenden Sie nur den Miningstrukturtestsatz ohne Filter, um sicherzustellen, dass für alle Modelle ein konsistenter Satz von Daten verwendet wird.Or, use only the mining structure test set with no filters to ensure that a consistent set of data is used for all models.

    Wenn Sie die Kreuzvalidierung mit den gespeicherten Prozeduren ausführen, haben Sie zusätzlich die Option, die Quelle zum Testen von Daten auszuwählen.If you perform cross-validation by using the stored procedures, you have the additional option of choosing the source of testing data. Wenn Sie die Kreuzvalidierung mit dem Data Mining-Designer ausführen, müssen Sie das Testdataset verwenden, das dem Modell oder der Struktur zugeordnet ist.If you perform cross-validation by using the Data Mining Designer, you must use the testing data set that is associated with the model or structure, if any. Wenn Sie erweiterte Einstellungen angeben möchten, sollten Sie die gespeicherten Prozeduren für die Kreuzvalidierung verwenden.Generally, if you want to specify advanced settings, you should use the cross-validation stored procedures.

    Die Kreuzvalidierung kann nicht mit Zeitreihen- oder Sequenzclustermodellen verwendet werden.Cross-validation cannot be used with time series or sequence clustering models. Insbesondere gilt, dass kein Modell, das eine KEY TIME- oder KEY SEQUENCE-Spalte enthält, in der Kreuzvalidierung vorhanden sein kann.Specifically, no model that contains a KEY TIME column or a KEY SEQUENCE column can be included in cross-validation.

Weitere Informationen zur Kreuzvalidierung oder zu verwandten Methoden für das Testen von Miningmodellen, z. B. Genauigkeitsdiagramme, finden Sie in den folgenden Themen.See the following topics for more information about cross-validation, or information about related methods for testing mining models, such as accuracy charts.

ThemenTopics LinksLinks
Beschreibt, wie Kreuzvalidierungsparameter in SQL Server Development Studio festgelegt werden.Describes how to set cross-validation parameters in SQL Server Development Studio. Übergreifende Überprüfung (Registerkarte, Mininggenauigkeitsdiagramm-Sicht)Cross-Validation Tab (Mining Accuracy Chart View)
Beschreibt die Metriken, die von der Kreuzvalidierung bereitgestellt werden.Describes the metrics that are provided by cross-validation KreuzvalidierungsformelnCross-Validation Formulas
Erklärt das Kreuzvalidierungsberichtsformat und definiert die statistischen für jeden Modelltyp bereitgestellten Measures.Explains the cross-validation report format and defines the statistical measures provided for each model type. Measures im KreuzvalidierungsberichtMeasures in the Cross-Validation Report
Listet die gespeicherten Prozeduren zum Berechnen von Kreuzvalidierungsstatistiken auf.Lists the stored procedures for computing cross-validation statistics. Data Mining-gespeicherte Prozeduren (Analysis Services – Data Mining)Data Mining Stored Procedures (Analysis Services - Data Mining)
Beschreibt, wie ein Testdataset für Miningstrukturen und verwandte Modelle erstellt wird.Describes how to create a testing data set for mining structures and related models. Trainings- und TestdatasetsTraining and Testing Data Sets
Siehe Beispiele für weitere Genauigkeitsdiagrammtypen.See examples of other accuracy chart types. Klassifikationsmatrix (Analysis Services – Data Mining)Classification Matrix (Analysis Services - Data Mining)

Prognosegütediagramm (Analysis Services – Data Mining)Lift Chart (Analysis Services - Data Mining)

Gewinndiagramm (Analysis Services – Data Mining)Profit Chart (Analysis Services - Data Mining)

Punktdiagramm (Analysis Services – Data Mining)Scatter Plot (Analysis Services - Data Mining)
Beschreibt die Schritte zum Erstellen von verschiedenen Genauigkeitsdiagrammen.Describes steps for creating various accuracy charts. Tasks und Anweisungen für Test und Überprüfung (Data Mining)Testing and Validation Tasks and How-tos (Data Mining)

Siehe auchSee Also

Tests und Überprüfung (Data Mining)Testing and Validation (Data Mining)