Anforderungen und Überlegungen zur Verarbeitung (Data Mining)Processing Requirements and Considerations (Data Mining)

In diesem Thema werden in einige technische Überlegungen behandelt, die beim Verarbeiten von Data Mining-Objekten berücksichtigt werden sollten.This topic describes some technical considerations to keep in mind when processing data mining objects. Eine allgemeine Erklärung der Verarbeitung und deren Anwendung auf Data Mining finden Sie unter Verarbeiten von Data Mining-Objekten.For a general explanation of what processing is, and how it applies to data mining, see Processing Data Mining Objects.

Abfragen an relationalen SpeicherQueries on Relational Store

Verarbeiten von MiningstrukturenProcessing Mining Structures

Verarbeiten von MiningmodellenProcessing Mining Models

Abfragen an den relationalen Speicher während der VerarbeitungQueries on the Relational Store during Processing

Für Data Mining besteht der Verarbeitungsprozess aus drei Phasen: Abfragen der Quelldaten, Bestimmen der statistischen Rohdaten und Trainieren des Miningmodells mit der Modelldefinition und dem Modellalgorithmus.For data mining, there are three phases to processing: querying the source data, determining raw statistics, and using the model definition and algorithm to train the mining model.

Der Analysis ServicesAnalysis Services -Server gibt Abfragen an die Datenbank aus, die die Rohdaten bereitstellt.The Analysis ServicesAnalysis Services server issues queries to the database that provides the raw data. Bei dieser Datenbank kann es sich um eine Instanz von SQL Server 2017SQL Server 2017 oder einer früheren Version des SQL Server-Datenbankmoduls handeln.This database might be an instance of SQL Server 2017SQL Server 2017 or an earlier version of the SQL Server database engine. Beim Verarbeiten einer Data Mining-Struktur werden die Daten der Quelle an die Miningstruktur übertragen und in einem neuen komprimierten Format auf dem Datenträger gespeichert.When you process a data mining structure, the data in the source is transferred to the mining structure and persisted on disk in a new, compressed format. Es werden nicht alle Spalten der Datenquelle verarbeitet: Es werden nur die Spalten verarbeitet, die gemäß der Definition durch die Bindungen in der Miningstruktur enthalten sind.Not every column in the data source is processed: only the columns that are included in the mining structure, as defined by the bindings.

Mit den Rohdaten baut Analysis ServicesAnalysis Services einen Index aller Daten und diskretisierten Spalten auf und erstellt einen separaten Index für fortlaufende Spalten.Using this data, Analysis ServicesAnalysis Services builds an index of all data and discretized columns, and creates a separate index for continuous columns. Für jede geschachtelte Tabelle wird zum Erstellen des Index eine Abfrage ausgegeben. Eine weitere Abfrage wird für jede geschachtelte Tabelle generiert, um die Beziehungen zwischen den einzelnen Paaren einer geschachtelten Tabelle und Falltabelle zu verarbeiten.One query is issued for each nested table to create the index, and an additional query per nested table is generated to process relationships between each pair of a nested table and case table. Es werden mehrere Abfragen erstellt, um einen besonderen internen mehrdimensionalen Datenspeicher zu verarbeiten.The reason for creating multiple queries is to process a special internal multidimensional data store. Sie können die Anzahl der Abfragen, die von Analysis ServicesAnalysis Services an den relationalen Speicher gesendet werden, beschränken, indem Sie die Servereigenschaft DatabaseConnectionPoolMaxfestlegen.You can limit the number of queries that Analysis ServicesAnalysis Services sends to the relational store by setting the server property, DatabaseConnectionPoolMax. Weitere Informationen finden Sie unter OLAP Properties.For more information, see OLAP Properties.

Beim Verarbeiten des Modells liest das Modell die Daten nicht erneut von der Datenquelle, sondern ruft stattdessen die Zusammenfassung der Daten aus der Miningstruktur ab.When you process the model, the model does not reread the data from the data source, but instead gets the summary of the data from the mining structure. Mit dem erstellten Cube und den zwischengespeicherten Index- und Falldaten erstellt der Server unabhängige Threads zum Trainieren der Modelle.Using the cube that was created, together with the cached index and case data has been cached, the server creates independent threads to train the models.

Weitere Informationen zu den Editionen von SQL ServerSQL Server , die die parallele Modellverarbeitung unterstützen, finden Sie unter Von den SQL Server 2012-Editionen unterstützte Funktionen (http://go.microsoft.com/fwlink/?linkid=232473).For more information about the editions of SQL ServerSQL Server that support Parallel Model Processing, see Features Supported by the Editions of SQL Server 2012 (http://go.microsoft.com/fwlink/?linkid=232473).

Verarbeiten von MiningstrukturenProcessing Mining Structures

Eine Miningstruktur kann zusammen mit allen abhängigen Modellen oder getrennt verarbeitet werden.A mining structure can be processed together with all dependent models, or separately. Die Verarbeitung einer Miningstruktur getrennt von Modellen kann nützlich sein, wenn manche Modelle voraussichtlich eine lange Verarbeitungszeit benötigen und Sie diesen Vorgang aufschieben möchten.Processing a mining structure separately from models can be useful when some models are expected to take a long time to process and you want to defer that operation.

Weitere Informationen finden Sie unter Process a Mining Structure.For more information, see Process a Mining Structure.

Wenn es für Sie wichtig ist, Festplattenspeicherplatz zu sparen, beachten Sie, dass die von Analysis ServicesAnalysis Services beibehaltene Miningstruktur lokal zwischengespeichert wird.If you are concerned about conserving hard disk space, note that Analysis ServicesAnalysis Services retains mining structure caches locally. Das bedeutet, dass alle Trainingsdaten auf die lokale Festplatte geschrieben werden.That is, it writes out all the training data to your local hard disk. Wenn keine Daten zwischengespeichert werden sollen, können Sie die Standardeinstellung ändern, indem Sie für die MiningStructureCacheMode -Eigenschaft der Miningstruktur auf ClearAfterProcessing.If you do not want the data cached, you can change the default by setting the MiningStructureCacheMode property on the mining structure to ClearAfterProcessing. Auf diese Weise wird der Zwischenspeicher nach der Verarbeitung der Modelle gelöscht, und außerdem wird Drillthrough für die Miningstruktur deaktiviert.This will destroy the cache after models are processed; however, it will also disable drillthrough on the mining structure. Weitere Informationen finden Sie unter Drillthroughabfragen (Data Mining).For more information, see Drillthrough Queries (Data Mining).

Wenn Sie den Cache löschen, können Sie außerdem nicht den Zurückhaltungstestsatz verwenden, wenn Sie einen solchen definiert haben, und die Definition der Testsatzpartition geht verloren.Also, if you clear the cache, you will not be able to use the holdout test set, if you defined one, and the definition of the test set partition will be lost. Weitere Informationen zu Zurückhaltungstestsätzen finden Sie unter Trainings- und Testdatasets.For more information about holdout test sets, see Training and Testing Data Sets.

Verarbeiten von MiningmodellenProcessing Mining Models

Sie können ein Miningmodell getrennt von seiner zugeordnete Miningstruktur verarbeiten, oder Sie können alle Modelle, die auf der Struktur basieren, zusammen mit der Struktur verarbeiten.You can process a mining model separately from its associated mining structure, or you can process all models that are based on the structure, together with the structure.

Weitere Informationen finden Sie unter Verarbeiten eines Miningmodells.For more information, see Process a Mining Model.

In SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) und SQL Server Management StudioSQL Server Management Studiokönnen Sie jedoch nicht mehrere Miningmodelle für die Verarbeitung mit der Struktur auswählen.However, in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) and SQL Server Management StudioSQL Server Management Studio, you cannot multiselect mining models to process with the structure. Wenn Sie steuern müssen, welche Modelle verarbeitet werden, müssen Sie sie einzeln auswählen oder XMLA bzw. DMX verwenden, um die Modelle seriell zu verarbeiten.If you need to control which models are processed, you must select them individually, or use XMLA or DMX to process models serially.

Wenn Neuverarbeitung erforderlich istWhen Reprocessing is Required

Sie müssen die von Ihnen definierten Analysis ServicesAnalysis Services -Modelle verarbeiten, bevor Sie damit arbeiten können.You must process the Analysis ServicesAnalysis Services models that you define before you can start to work with them. Darüber hinaus müssen Sie die Miningmodelle immer dann neu verarbeiten, wenn Sie Änderungen an der Struktur des Miningmodells vornehmen, die Trainingsdaten aktualisieren, ein vorhandenes Miningmodell ändern oder der Struktur ein neues Miningmodell hinzufügen.You must also reprocess the mining models whenever you change the mining model structure, update the training data, change an existing mining model, or add a new mining model to the structure.

Miningmodelle werden auch in folgenden Szenarien verarbeitet:Mining models are also processed in these scenarios:

Bereitstellung eines Projekts: Abhängig von den Projekteinstellungen und dem aktuellen Projektstatus werden die Miningmodelle im Projekt in der Regel zum Zeitpunkt der Bereitstellung des Projekts vollständig verarbeitet.Deployment of a project: Depending on the project settings and the current state of the project, the mining models in the project are typically processed in full when the project is deployed.

Beim Initiieren der Bereitstellung beginnt die Verarbeitung automatisch, es sei denn, auf dem Analysis ServicesAnalysis Services -Server befindet sich eine zu einem früheren Zeitpunkt verarbeitete Version und es gibt keine strukturellen Änderungen.When you initiate deployment, processing starts automatically, unless there is a previously processed version on the Analysis ServicesAnalysis Services server and there have been no structural changes. Wählen Sie in der Dropdownliste Projektmappe bereitstellen aus, oder drücken Sie F5, um ein Projekt bereitzustellen.You can deploy a project by selecting Deploy solution from the drop-down list or by pressing the F5 key. Folgende Aktionen sind möglich:You can

Weitere Informationen zum Festlegen von Analysis ServicesAnalysis Services -Bereitstellungseigenschaften, die steuern, wie Miningmodelle bereitgestellt werden, finden Sie unter Bereitstellen von Data Mining-Lösungen.For more information about how to set Analysis ServicesAnalysis Services deployment properties that control how mining models are deployed, see Deployment of Data Mining Solutions.

Verschieben eines Miningmodells: Wenn Sie mit dem EXPORT-Befehl ein Miningmodell verschieben, wird nur die Definition des Modells exportiert. Dazu gehört der Name der Miningstruktur, die Daten an das Modell bereitstellen soll.Moving a mining model: When you move a mining model by using the EXPORT command, only the definition of the model is exported, which includes the name of the mining structure that is expected to provide data to the model.

Neuverarbeitungsanforderungen für die folgenden Szenarien, die die Befehle EXPORT und IMPORT verwenden:Reprocessing requirements for the following scenarios using the EXPORT and IMPORT commands:

  • Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur befindet sich in einem nicht verarbeiteten Status.The mining structure exists on the target instance and the mining structure is in an unprocessed state.

    Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.Both the structure and model must be reprocessed.

  • Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur wurde verarbeitet.The mining structure exists on the target instance and the mining structure has been processed. Nur das Miningmodell wurde exportiert.Only the mining model was exported.

    Das Modell kann ohne Verarbeitung verwendet werden.The model can be used without processing.

  • Die Miningstrukturdefinition wurde ebenfalls mit dem WITH DEPENDENCIES-Schlüsselwort exportiert.The mining structure definition was also exported by using the WITH DEENDENCIES keyword.

    Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.Both the structure and model must be reprocessed.

    Weitere Informationen finden Sie unter Exportieren und Importieren von Data Mining-Objekten.For more information, see Export and Import Data Mining Objects.

Siehe auchSee Also

Miningstrukturen (Analysis Services – Data Mining) Mining Structures (Analysis Services - Data Mining)
Miningstrukturen (Analysis Services – Data Mining) Mining Structures (Analysis Services - Data Mining)
Verarbeiten eines mehrdimensionalen Modells (Analysis Services)Processing a multidimensional model (Analysis Services)