Miningstrukturen (Analysis Services - Data Mining)Mining Structures (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesDie Miningstruktur definiert die Daten aus der die Miningmodelle erstellt werden: Es gibt die Quelle an, die Anzahl und Typ von Spalten und eine optionale Partitionierung in Trainings- und Testsätze. The mining structure defines the data from which mining models are built: it specifies the source data view, the number and type of columns, and an optional partition into training and testing sets. Eine einzelne Miningstruktur kann mehrere Miningmodelle unterstützen, die die gleiche Domäne verwenden.A single mining structure can support multiple mining models that share the same domain. In der folgenden Abbildung ist die Beziehung der Data Mining-Struktur zur Datenquelle und zu den dazugehörigen Data Mining-Modellen dargestellt.The following diagram illustrates the relationship of the data mining structure to the data source, and to its constituent data mining models.

Datenverarbeitung: Quelle Struktur ModellProcessing of data: source to structure to model

Die Miningstruktur in der Abbildung basiert auf einer Datenquelle, die mehrere Tabellen oder Sichten enthält, die über das Feld CustomerID verknüpft sind.The mining structure in the diagram is based on a data source that contains multiple tables or views, joined on the CustomerID field. Eine Tabelle enthält Informationen zu Kunden, wie geografische Region, Alter, Einkommen und Geschlecht, während die dazugehörige geschachtelte Tabelle mehrere Zeilen mit Zusatzinformationen zu den einzelnen Kunden enthält, z. B. vom Kunden gekaufte Produkte.One table contains information about customers, such as the geographical region, age, income and gender, while the related nested table contains multiple rows of additional information about each customer, such as products the customer has purchased. Die Abbildung zeigt, dass mehrere Modelle für eine Miningstruktur erstellt werden können und dass die Modelle unterschiedliche Spalten der Struktur verwenden können.The diagram shows that multiple models can be built on one mining structure, and that the models can use different columns from the structure.

Modell 1 Verwendet CustomerID, Einkommen, Alter, Region und filtert die Daten nach der Region.Model 1 Uses CustomerID, Income, Age, Region, and filters the data on Region.

Modell 2 Verwendet CustomerID, Einkommen, Alter, Region und filtert die Daten nach dem Alter.Model 2 Uses CustomerID, Income, Age, Region and filters the data on Age.

Model 3 Verwendet CustomerID, Alter, Geschlecht und die geschachtelte Tabelle ohne Filter.Model 3 Uses CustomerID, Age, Gender, and the nested table, with no filter.

Da die Modelle unterschiedliche Spalten als Eingabe verwenden und zwei Modelle die im Modell verwendeten Daten mithilfe von Filtern zusätzlich beschränken, können die Modelle stark unterschiedliche Ergebnisse aufweisen, obwohl sie auf denselben Daten basieren.Because the models use different columns for input, and because two of the models additionally restrict the data that is used in the model by applying a filter, the models might have very different results even though they are based on the same data. Beachten Sie, dass die Spalte CustomerID in allen Modellen erforderlich ist, da es sich um die einzige Spalte handelt, die als Fallschlüssel verwendet werden kann.Note that the CustomerID column is required in all models because it is the only available column that can be used as the case key.

In diesem Abschnitt wird die grundlegende Architektur der Data Mining-Strukturen erläutert, z. B., wie Sie eine Miningstruktur definieren, die Struktur mit Daten auffüllen und diese für die Modellerstellung einsetzen.This section explains the basic architecture of data mining structures: how you define a mining structure, how you populate it with data, and how you use it to create models. Weitere Informationen zum Verwalten oder Exportieren vorhandener Data Mining-Strukturen finden Sie unter Verwaltung von Data Mining-Lösungen und -Objekten.For more information about how to manage or export existing data mining structures, see Management of Data Mining Solutions and Objects.

Definieren einer MiningstrukturDefining a Mining Structure

Zum Einrichten einer Data Mining-Struktur müssen folgende Schritte ausgeführt werden:Setting up a data mining structure includes the following steps:

  • Definieren Sie eine Datenquelle.Define a data source.

  • Wählen Sie Datenspalten aus, die in die Struktur aufgenommen werden sollen (nicht alle Spalten müssen dem Modell hinzugefügt werden), und definieren Sie einen Schlüssel.Select columns of data to include in the structure (not all columns need to be added to the model) and defining a key.

  • Definieren Sie einen Schlüssel für die Struktur, einschließlich des Schlüssels für die geschachtelte Tabelle (sofern vorhanden).Define a key for the structure, including the key for the bested table, if applicable.

  • Geben Sie an, ob die Quelldaten in einen Trainings- und einen Testsatz unterteilt werden sollen.Specify whether the source data should be separate into a training set and testing set. Dies ist ein optionaler Schritt.This step is optional.

  • Verarbeiten Sie die Struktur.Process the structure.

    Diese Schritte werden in den folgenden Abschnitten ausführlicher beschrieben.These steps are described in more detail in the following sections.

Datenquellen für MiningstrukturenData Sources for Mining Structures

Beim Definieren einer Miningstruktur können Sie Spalten verwenden, die in einer vorhandenen Datenquellensicht verfügbar sind.When you define a mining structure, you use columns that are available in an existing data source view. Eine Datenquellensicht ist ein freigegebenes Objekt, mit dem Sie mehrere Datenquellen kombinieren und als einzelne Quelle verwenden können.A data source view is a shared object that lets you combine multiple data sources and use them as a single source. Die ursprünglichen Datenquellen sind für Clientanwendungen nicht sichtbar, und Sie können die Eigenschaften der Datenquellensicht verwenden, um Datentypen zu ändern und um Aggregationen oder Aliase für Spalten zu erstellen.The original data sources are not visible to client applications, and you can use the properties of the data source view to modify data types, create aggregations, or alias columns.

Wenn Sie mehrere Miningmodelle aus derselben Miningstruktur erstellen, können in den Modellen unterschiedliche Spalten aus der Struktur verwendet werden.If you build multiple mining models from the same mining structure, the models can use different columns from the structure. Sie können z. B. eine einzelne Struktur erstellen und dann auf deren Grundlage separate Entscheidungsstruktur- und Clusteringmodelle erstellen, wobei in jedem Modell unterschiedliche Spalten verwendet und verschiedene Attribute vorhergesagt werden.For example, you can create a single structure and then build separate decision tree and clustering models from it, with each model using different columns and predicting different attributes.

Darüber hinaus kann jedes Modell die Spalten der Struktur auf unterschiedliche Weise verwenden.Moreover, each model can use the columns from the structure in different ways. Die Datenquellensicht könnte z. B. eine Spalte "Einkommen"enthalten, die Sie je nach Modell auf unterschiedliche Weise speichern können.For example, your data source view might contain an Income column, which you can bin in different ways for different models.

Die Data Mining-Struktur speichert die Definition der Datenquelle und die darin enthaltenen Spalten in Form von Bindungen mit der Datenquelle.The data mining structure stores the definition of the data source and the columns in it in the form of bindings to the source data. Weitere Informationen zu Datenquellenbindungen finden Sie unter Datenquellen und Bindungen (SSAS – mehrdimensional).For more information about data source bindings, see Data Sources and Bindings (SSAS Multidimensional). Sie können eine Data Mining-Struktur auch erstellen, ohne diese an eine bestimmte Datenquelle zu binden, indem Sie die DMX-Anweisung CREATE MINING STRUCTURE (DMX) verwenden.However, note that you can also create a data mining structure without binding it to a specific data source by using the DMX CREATE MINING STRUCTURE (DMX) statement.

MiningstrukturspaltenMining Structure Columns

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben.The building blocks of the mining structure are the mining structure columns, which describe the data that the data source contains. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.These columns contain information such as data type, content type, and how the data is distributed. In der Miningstruktur sind keine Informationen über die Verwendung der Spalten für bestimmte Miningmodelle enthalten, und auch keine Informationen über den Algorithmustyp, der zum Erstellen eines Modells verwendet wird. Diese Informationen werden im Miningmodell selbst definiert.The mining structure does not contain information about how columns are used for a specific mining model, or about the type of algorithm that is used to build a model; this information is defined in the mining model itself.

Eine Miningstruktur kann auch geschachtelte Tabellen enthalten.A mining structure can also contain nested tables. Eine geschachtelte Tabelle stellt eine 1:n-Beziehung zwischen der Entität eines Falls und der damit verknüpften Attribute dar.A nested table represents a one-to-many relationship between the entity of a case and its related attributes. Bei Informationen beispielsweise, die beschreiben, dass sich ein Kunde in einer Tabelle und die Einkäufe des Kunden in einer anderen Tabelle befinden, können Sie geschachtelte Tabellen verwenden, um die Informationen in einem einzelnen Fall zu kombinieren.For example, if the information that describes the customer resides in one table, and the customer's purchases reside in another table, you can use nested tables to combine the information into a single case. Der Kundenbezeichner ist die Entität, und die Einkäufe sind die verknüpften Attribute.The customer identifier is the entity, and the purchases are the related attributes. Weitere Informationen dazu, wann die Verwendung geschachtelter Tabellen empfehlenswert ist, finden Sie unter Geschachtelte Tabellen (Analysis Services – Data Mining).For more information about when to use nested tables, see Nested Tables (Analysis Services - Data Mining).

Um in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT)ein Data Mining-Modell zu erstellen, müssen Sie zuerst eine Data Mining-Struktur erstellen.To create a data mining model in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT), you must first create a data mining structure. Der Data Mining-Assistent führt Sie durch die Erstellung einer Data Mining-Struktur, die Datenauswahl und das Hinzufügen eines Miningmodells.The Data Mining wizard walks you through the process of creating a mining structure, choosing data, and adding a mining model.

Wenn Sie mithilfe der Data Mining-Erweiterungen (DMX) ein Miningmodell erstellen, können Sie das Modell und die darin enthaltenen Spalten angeben. DMX erstellt dann automatisch die erforderliche Data Mining-Struktur.If you create a mining model by using Data Mining Extensions (DMX), you can specify the model and the columns in it, and DMX will automatically create the required mining structure. Weitere Informationen finden Sie unter CREATE MINING MODEL (DMX).For more information, see CREATE MINING MODEL (DMX).

Weitere Informationen finden Sie unter Mining Structure Columns.For more information, see Mining Structure Columns.

Unterteilen der Daten in einen Trainings- und TestsatzDividing the Data into Training and Testing Sets

Wenn Sie die Daten für die Miningstruktur definieren, können Sie auch angeben, dass einige Daten für Trainings- und andere für Testzwecke verwendet werden sollen.When you define the data for the mining structure, you can also specify that some of the data be used for training, and some for testing. Daher ist es nicht mehr erforderlich, die Daten vor der Erstellung einer Data Mining-Struktur zu unterteilen.Therefore, it is no longer necessary to separate your data in advance of creating a data mining structure. Während Sie das Modell erstellen, können Sie stattdessen angeben, dass ein bestimmter Prozentsatz der Daten für Testzwecke zurückgehalten und der Rest zum Training verwendet werden soll, oder Sie können eine bestimmte Anzahl von Fällen als Testdataset angeben.Instead, while you create your model, you can specify that a certain percentage of the data be held out for testing, and the rest used for training, or you can specify a certain number of cases to use as the test data set. Die Informationen zu den Trainings- und Testdatasets werden mit der Miningstruktur zwischengespeichert. Folglich kann derselbe Testsatz für alle Modelle verwendet werden, die auf dieser Struktur basieren.The information about the training and testing data sets is cached with the mining structure, and as a result, the same test set can be used with all models that are based on that structure.

Weitere Informationen finden Sie unter Training and Testing Data Sets.For more information, see Training and Testing Data Sets.

Aktivieren von DrillthroughEnabling Drillthrough

Sie können der Miningstruktur Spalten hinzufügen, auch wenn Sie nicht beabsichtigen, die betreffenden Spalten in einem bestimmten Miningmodell zu verwenden.You can add columns to the mining structure even if you do not plan to use the column in a specific mining model. Dies ist beispielsweise hilfreich, wenn Sie die E-Mail-Adressen von Kunden in einem Clustermodell abrufen möchten, ohne die E-Mail-Adresse in der Analyse zu verwenden.This is useful if, for example, you want to retrieve the e-mail addresses of customers in a clustering model, without using the e-mail address during the analysis process. Um eine Spalte während der Analyse- und Vorhersagephase zu ignorieren, fügen Sie sie der Struktur hinzu, ohne jedoch das Verwendungsflag für die Spalte anzugeben. Alternativ können Sie das Verwendungsflag auf Ignorieren festlegen.To ignore a column during the analysis and prediction phase, you add it to the structure but do not specify a usage for the column, or set the usage flag to Ignore. Auf diese Weise gekennzeichnete Daten können weiterhin in Abfragen verwendet werden, wenn Drillthroughs für das Miningmodell aktiviert wurden und wenn Sie über die entsprechenden Berechtigungen verfügen.Data flagged in this way can still be used in queries if drillthrough has been enabled on the mining model, and if you have the appropriate permissions. Beispielsweise können Sie die Cluster überprüfen, die sich aus der Analyse aller Kunden ergeben, und dann eine Drillthroughabfrage ausführen, um die Namen und E-Mail-Adressen der in einem bestimmten Cluster enthaltenen Kunden abzurufen. Dies ist möglich, obwohl diese Datenspalten nicht für die Modellerstellung verwendet wurden.For example, you could review the clusters resulting from analysis of all customers, and then use a drillthrough query to get the names and e-mail addresses of customers in a particular cluster, even though those columns of data were not used to build the model.

Weitere Informationen finden Sie unter Drillthroughabfragen (Data Mining).For more information, see Drillthrough Queries (Data Mining).

Verarbeiten von MiningstrukturenProcessing Mining Structures

Eine Miningstruktur ist bis zu ihrer Verarbeitung lediglich ein Metadatencontainer.A mining structure is just a metadata container until it is processed. Beim Verarbeiten einer Miningstruktur erstellt Analysis ServicesAnalysis Services einen Cache, in dem statistische Informationen zu den Daten, Informationen zur Diskretisierung kontinuierlicher Attribute sowie weitere Informationen gespeichert werden, die später von Miningmodellen verwendet werden.When you process a mining structure, Analysis ServicesAnalysis Services creates a cache that stores statistics about the data, information about how any continuous attributes are discretized, and other information that is later used by mining models. Diese Zusammenfassungsinformationen werden im Miningmodell selbst nicht gespeichert, stattdessen verweist es auf die Informationen, die bei der Verarbeitung der Miningstruktur zwischengespeichert wurden.The mining model itself does not store this summary information, but instead references the information that was cached when the mining structure was processed. Sie müssen die Struktur folglich nicht jedes Mal neu verarbeiten, wenn Sie einer vorhandenen Struktur ein neues Modell hinzufügen; stattdessen können Sie einfach das Modell verarbeiten.Therefore, you do not need to reprocess the structure each time you add a new model to an existing structure; you can process just the model.

Sie können sich dazu entschließen, den Inhalt dieses Caches nach der Verarbeitung zu verwerfen, wenn der Cache sehr groß ist oder Sie detaillierte Daten entfernen möchten.You can opt to discard this cache after processing, if the cache is very large or you want to remove detailed data. Wenn keine Daten zwischengespeichert werden sollen, können Sie die CacheMode -Eigenschaft der Miningstruktur in ClearAfterProcessingändern.If you do not want the data to be cached, you can change the CacheMode property of the mining structure to ClearAfterProcessing. Der Cache wird dann gelöscht, nachdem alle Modelle verarbeitet wurden.This will destroy the cache after any models are processed. Wenn Sie die CacheMode -Eigenschaft auf ClearAfterProcessing setzen, wird der Drillthrough des Miningmodells deaktiviert.Setting the CacheMode property to ClearAfterProcessing will disable drillthrough from the mining model.

Nachdem Sie den Cache gelöscht haben, können Sie der Miningstruktur jedoch keine neuen Modelle mehr hinzuzufügen.However, after you destroy the cache, you will not be able to add new models to the mining structure. Wenn Sie der Struktur ein neues Miningmodell hinzufügen oder die Eigenschaften vorhandener Modelle ändern, müsste die Miningstruktur zuerst erneut verarbeitet werden.If you add a new mining model to the structure, or change the properties of existing models, you would need to reprocess the mining structure first. Weitere Informationen finden Sie unter Anforderungen und Überlegungen zur Verarbeitung (Data Mining).For more information, see Processing Requirements and Considerations (Data Mining).

Anzeigen von MiningstrukturenViewing Mining Structures

Sie können keine Viewer verwenden, um die Daten in einer Miningstruktur zu durchsuchen.You cannot use viewers to browse the data in a mining structure. In SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT)können Sie allerdings die Registerkarte Miningstruktur im Data Mining-Designer verwenden, um die Strukturspalten und deren Definitionen anzuzeigen.However, in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT), you can use the Mining Structure tab of Data Mining Designer to view the structure columns and their definitions. Weitere Informationen finden Sie unter Data Mining Designer.For more information, see Data Mining Designer.

Wenn Sie die Daten in der Miningstruktur überprüfen möchten, können Sie mithilfe der Data Mining-Erweiterungen (DMX) Abfragen erstellen.If you want to review the data in the mining structure, you can create queries by using Data Mining Extensions (DMX). So gibt zum Beispiel die Anweisung SELECT * FROM <structure>.CASES alle Daten in der Miningstruktur zurück.For example, the statement SELECT * FROM <structure>.CASES returns all the data in the mining structure. Zum Abrufen dieser Informationen muss die Miningstruktur verarbeitet und die Ergebnisse der Verarbeitung müssen zwischengespeichert worden sein.To retrieve this information, the mining structure must have been processed, and the results of processing must be cached.

Die Anweisung SELECT * FROM <model>.CASES gibt die gleichen Spalten zurück, aber nur für die Fälle in dem betreffenden Modell.The statement SELECT * FROM <model>.CASES returns the same columns, but only for the cases in that particular model. Weitere Informationen finden Sie unter SELECT FROM <structure>.CASES und SELECT FROM <model>.CASES (DMX).For more information, see SELECT FROM <structure>.CASES and SELECT FROM <model>.CASES (DMX).

Verwenden von Data Mining-Modellen mit MiningstrukturenUsing Data Mining Models with Mining Structures

Ein Data Mining-Modell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.A data mining model applies a mining model algorithm to the data that is represented by a mining structure. Ein Miningmodell ist ein Objekt, das einer bestimmten Miningstruktur angehört. Es erbt alle Werte der durch die Miningstruktur definierten Eigenschaften.A mining model is an object that belongs to a particular mining structure, and the model inherits all the values of the properties that are defined by the mining structure. Das Modell kann alle Spalten aus der Miningstruktur oder nur eine Teilmenge der Spalten verwenden.The model can use all the columns that the mining structure contains or a subset of the columns. Sie können einer Struktur mehrere Kopien einer Strukturspalte hinzufügen.You can add multiple copies of a structure column to a structure. Außerdem können Sie einem Modell mehrere Kopien einer Strukturspalte hinzufügen und dann den einzelnen Strukturspalten im Modell verschiedene Namen, so genannte Aliase, zuweisen.You can also add multiple copies of a structure column to a model, and then assign different names, or aliases, to each structure column in the model. Weitere Informationen zu Alias von Strukturspalten finden Sie unter Erstellen eines Alias für eine Modellspalte und Miningmodelleigenschaften.For more information about aliasing structure columns, see Create an Alias for a Model Column and Mining Model Properties.

Weitere Informationen zur Architektur von Data Mining-Modellen finden Sie unter Miningmodelle (Analysis Services – Data Mining).For more information about the architecture of data mining models, see Mining Models (Analysis Services - Data Mining).

Verwenden Sie die im Folgenden angegebenen Links, um weitere Informationen zum Definieren, Verwalten und Verwenden von Miningstrukturen zu erhalten.Use the links provided her to learn more about how to define, manage, and use mining structures.

AufgabenTasks LinksLinks
Arbeiten mit relationalen MiningstrukturenWork with relational mining structures Erstellen einer neuen relationalen MiningstrukturCreate a New Relational Mining Structure

Hinzufügen einer geschachtelten Tabelle zu einer MiningstrukturAdd a Nested Table to a Mining Structure
Arbeiten mit Miningstrukturen, die auf Cubes basierenWork with mining structures based on OLAP cubes Erstellen einer neuen OLAP-MiningstrukturCreate a New OLAP Mining Structure
Arbeiten mit Spalten in einer MiningstrukturWork with columns in a mining structure Hinzufügen von Spalten zu einer MiningstrukturAdd Columns to a Mining Structure

Entfernen von Spalten aus einer MiningstrukturRemove Columns from a Mining Structure
Ändern oder Abfragen von Eigenschaften und Daten einer MiningstrukturChange or query mining structure properties and data Ändern der Eigenschaften einer MiningstrukturChange the Properties of a Mining Structure
Arbeiten mit den zugrunde liegenden Datenquellen und Aktualisieren von QuelldatenWork with the underlying data sources and update source data Bearbeiten der für eine Miningstruktur verwendeten DatenquellensichtEdit the Data Source View used for a Mining Structure

Verarbeiten einer MiningstrukturProcess a Mining Structure

Siehe auchSee Also

Datenbankobjekte (Analysis Services – Mehrdimensionale Daten) Database Objects (Analysis Services - Multidimensional Data)
Miningmodelle (Analysis Services – Data Mining)Mining Models (Analysis Services - Data Mining)