Logische Architektur (Analysis Services - Data Mining)Logical Architecture (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesDatamining ist ein Prozess, der dem mehrere Komponenten interagieren. Data mining is a process that involves the interaction of multiple components.

  • Sie greifen auf Datenquellen in einer SQL Server-Datenbank oder auf eine beliebige andere Datenquelle zu, um diese zum Training, für Tests oder für Vorhersagen zu verwenden.You access sources of data in a SQL Server database or any other data source to use for training, testing, or prediction.

  • Sie definieren Data Mining-Strukturen und -Modelle mithilfe von SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) oder Visual Studio.You define data mining structures and models by using SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) or Visual Studio.

  • Sie verwalten Data Mining-Objekte und erstellen Vorhersagen und Abfragen, indem Sie SQL Server Management StudioSQL Server Management Studioverwenden.You manage data mining objects and create predictions and queries by using SQL Server Management StudioSQL Server Management Studio.

  • Nachdem Sie die Lösung fertig gestellt haben, können Sie sie als Instanz von Analysis ServicesAnalysis Servicesbereitstellen.When the solution is complete, you deploy it to an instance of Analysis ServicesAnalysis Services.

    Der Prozess hinsichtlich der Erstellung dieser Lösungsobjekte wurde bereits an anderer Stelle beschrieben.The process of creating these solution objects has already been described elsewhere. Weitere Informationen finden Sie unter Data Mining-Projektmappen.For more information, see Data Mining Solutions.

    In den folgenden Abschnitten wird die logische Architektur der Objekte in einer Data Mining-Lösung beschrieben.The following sections describe the logical architecture of the objects in a data mining solution.

    Data Mining-QuelldatenData Mining Source Data

    MiningstrukturenMining Structures

    MiningmodelleMining Models

    Benutzerdefinierte Data Mining-ObjekteCustom Data Mining Objects

Data Mining-QuelldatenData Mining Source Data

Die Daten, die Sie beim Data Mining verwenden, werden nicht in der Data Mining-Lösung gespeichert. Es werden nur die Bindungen gespeichert.The data that you use in data mining is not stored in the data mining solution; only the bindings are stored. Die Daten können sich in einer Datenbank befinden, die in einer vorherigen Version von SQL Server erstellt wurde, oder in einem CRM-System oder sogar einer Flatfile.The data might reside in a database created in a previous version of SQL Server, a CRM system, or even a flat file. Wenn für die Struktur oder das Modell ein Training auf Grundlage der Verarbeitung erfolgt, wird eine statistische Zusammenfassung der Daten erstellt und in einem Cache gespeichert, der zur Verwendung in späteren Vorgängen beibehalten oder nach der Verarbeitung gelöscht werden kann.When you train the structure or model by processing, a statistical summary of the data is created and stored in a cache that can be persisted for use in later operations, or deleted after processing. Weitere Informationen finden Sie unter Miningstrukturen (Analysis Services – Data Mining).For more information, see Mining Structures (Analysis Services - Data Mining).

Sie kombinieren ungleichartige Daten innerhalb des Analysis ServicesAnalysis Services-Datenquellensicht-Objekts (DSV), das im oberen Bereich der Datenquelle eine Abstraktionsebene bereitstellt.You combine disparate data within the Analysis ServicesAnalysis Services data source view (DSV) object, which provides an abstraction layer on top of your data source. Sie können Joins zwischen Tabellen festlegen oder Tabellen hinzufügen, die eine n:1-Beziehung aufweisen, um geschachtelte Tabellenspalten zu erstellen.You can specify joins between tables, or add tables that have a many-to-one relationship to create nested table columns. Die Definitionen dieser Objekte, der Datenquelle und der Datenquellensicht werden innerhalb der Projektmappe mit den Dateinamenerweiterungen *.ds oder *.dsv gespeichert.The definition of these objects, the data source and the data source view, are stored within the solution with the file name extensions, *.ds and *.dsv. Weitere Informationen zur Erstellung und Verwendung von Analysis ServicesAnalysis Services-Datenquellen und -Datenquellensichten finden Sie unter Unterstützte Datenquellen (SSAS – Mehrdimensional).For more information about creating and using Analysis ServicesAnalysis Services data sources and data source views, see Supported Data Sources (SSAS - Multidimensional).

Sie können Datenquellen und Datenquellensichten auch definieren und ändern, indem Sie AMO oder XMLA verwenden.You can also define and alter data sources and data source views by using AMO or XMLA. Weitere Informationen zum programmgesteuerten Arbeiten mit diesen Objekten finden Sie unter Übersicht über logische Architektur (Analysis Services – Mehrdimensionale Daten).For more information about working with these objects programmatically, see Logical Architecture Overview (Analysis Services - Multidimensional Data).

Mining StructuresMining Structures

Eine Data Mining-Struktur ist ein logischer Datencontainer, der die Datendomäne definiert, aus der die Miningmodelle erstellt werden.A data mining structure is a logical data container that defines the data domain from which mining models are built. Eine einzelne Miningstruktur kann mehrere Miningmodelle unterstützen.A single mining structure can support multiple mining models.

Wenn Sie die Daten in der Data Mining-Lösung verwenden müssen, liest Analysis Services die Daten aus der Quelle aus und erzeugt einen Cache mit Aggregaten und weiteren Informationen.When you need to use the data in the data mining solution, Analysis Services reads the data from the source and generates a cache of aggregates and other information. Standardmäßig wird dieser Cache beibehalten, damit Trainingsdaten wiederverwendet werden können, um zusätzliche Modelle zu unterstützen.By default this cache is persisted so that training data can be reused to support additional models. Wenn Sie den Cache löschen müssen, ändern Sie die CacheMode -Eigenschaft des Miningstrukturobjekts in den Wert ClearAfterProcessing.If you need to delete the cache, change the CacheMode property on the mining structure object to the value, ClearAfterProcessing. Weitere Informationen finden Sie unter AMO-Klassen für Data Mining.For more information, see AMO Data Mining Classes.

Analysis Services bietet die Möglichkeit, die der Trennung Ihrer Daten in Trainings- und testdatasets, sodass Sie die Mining-Modelle auf einem repräsentativen, zufällig ausgewählten Satz von Daten testen können.Analysis Services also provides the ability to separate your data into training and testing data sets, so that you can test your mining models on a representative, randomly selected set of data. Die Daten werden eigentlich nicht getrennt gespeichert. Im Strukturcache werden die Falldaten eher mit einer Eigenschaft markiert, die angibt, ob der jeweilige Fall für Trainings- oder für Testzwecke verwendet wird.The data is not actually stored separately; rather, case data in the structure cache is marked with a property that indicates whether that particular case is used for training or for testing. Wenn der Cache gelöscht wird, können diese Informationen nicht abgerufen werden.If the cache is deleted, that information cannot be retrieved.

Weitere Informationen finden Sie unter Miningstrukturen (Analysis Services – Data Mining).For more information, see Mining Structures (Analysis Services - Data Mining).

Eine Data Mining-Struktur kann geschachtelte Tabellen enthalten.A data mining structure can contain nested tables. In einer geschachtelten Tabelle werden weitere Details zu dem Fall bereitgestellt, der in der primären Datentabelle modelliert ist.A nested table provides additional detail about the case that is modeled in the primary data table. Weitere Informationen finden Sie unter Geschachtelte Tabellen (Analysis Services – Data Mining).For more information, see Nested Tables (Analysis Services - Data Mining)

Mining ModelsMining Models

Vor der Verarbeitung stellt ein Data Mining-Modell lediglich eine Kombination aus Metadateneigenschaften dar.Before processing, a data mining model is only a combination of metadata properties. Diese Eigenschaften spezifizieren eine Miningstruktur, einen Data Mining-Algorithmus und eine bestimmte Auflistung von Parameter- und Filtereinstellungen, die sich auf die Art der Verarbeitung der Daten auswirken.These properties specify a mining structure, specify a data mining algorithm, and a define collection of parameter and filter settings that affect how the data is processed. Weitere Informationen finden Sie unter Miningmodelle (Analysis Services – Data Mining).For more information, see Mining Models (Analysis Services - Data Mining).

Wenn Sie das Modell verarbeiten, werden die im Cache der Miningstruktur gespeicherten Trainingsdaten dazu verwendet, Muster zu generieren. Dies geschieht auf der Grundlage sowohl der statistischen Eigenschaften der Daten als auch der vom Algorithmus und dessen Parametern definierten Heuristik.When you process the model, the training data that was stored in the mining structure cache is used to generate patterns, based both on statistical properties of the data and on heuristics defined by the algorithm and its parameters. Dies wird auch als Trainieren des Modells bezeichnet.This is known as training the model.

Das Ergebnis des Trainings stellt einen Satz von Zusammenfassungsdaten dar. Diese sind im Modellinhaltenthalten, der die gefundenen Muster beschreibt und Regeln bereitstellt, mit deren Hilfe Vorhersagen generiert werden können.The result of training is a set of summary data, contained within the model content, which describes the patterns that were found and provides rules by which to generate predictions. Weitere Informationen finden Sie unter Miningmodellinhalt (Analysis Services – Data Mining).For more information, see Mining Model Content (Analysis Services - Data Mining).

In beschränkten Fällen kann die logische Struktur des Modells auch in eine Datei exportiert werden, die Modellformeln und Datenbindungen gemäß dem Standardformat der PMML (Predictive Model Markup Language) darstellt.In limited cases, the logical structure of the model can also be exported into a file that represents model formulas and data bindings according to a standard format, the Predictive Modeling Markup Language (PMML). Diese logische Struktur kann in andere Systeme importiert werden, die PMML verwenden. Außerdem kann das so beschriebene Modell dann zur Vorhersage verwendet werden.This logical structure can be imported into other systems that utilize PMML and the model so described can then be used for prediction. Weitere Informationen finden Sie unter Grundlegendes zur SELECT-Anweisung (DMX).For more information, see Understanding the DMX Select Statement.

Benutzerdefinierte Data Mining-ObjekteCustom Data Mining Objects

Andere Objekte, die Sie im Zusammenhang mit einem Data Mining-Projekt verwenden, wie z. B. Genauigkeitsdiagramme oder Vorhersageabfragen, werden nicht innerhalb der Lösung beibehalten. Für sie kann aber mit ASSL ein Skript erstellt werden, oder sie können mit AMO erstellt werden.Other objects that you use in the context of a data mining project, such as accuracy charts or prediction queries, are not persisted within the solution, but can be scripted using ASSL or built using AMO.

Darüber hinaus können Sie die über eine Instanz von Analysis ServicesAnalysis Services verfügbaren Dienste und Funktionen durch das Hinzufügen der folgenden benutzerdefinierten Objekte erweitern:Additionally, you can extend the services and features available on an instance of Analysis ServicesAnalysis Services by adding these custom objects:

Benutzerdefinierte AssemblysCustom assemblies
.NET-Assemblys können mit einer beliebigen Reklamationssprache für CLR oder COM definiert und anschließend mit einer Instanz des SQL-Servers registriert werden..NET assemblies can be defined by using any CLR-or COM-complaint language, and then registered with an instance of SQL Server. Assemblydateien werden von der Position geladen, die von der Anwendung definiert wird. Außerdem wird eine Kopie zusammen mit den Daten auf dem Server gespeichert.Assembly files are loaded from the location defined by the application, and a copy is saved in the server along with the data. Die Kopie der Assemblydatei wird verwendet, um die Assembly bei jedem Start des Diensts zu laden.The copy of the assembly file is used to load the assembly every time the service is started.

Weitere Informationen finden Sie unter Verwaltung von mehrdimensionalen Modellassemblys.For more information, see Multidimensional Model Assemblies Management.

Benutzerdefinierte gespeicherte ProzedurenCustom stored procedures
Analysis ServicesAnalysis ServicesDatamining unterstützt die Verwendung von gespeicherten Prozeduren mit Datamining-Objekten arbeiten. data mining supports the use of stored procedures to work with data mining objects. Sie können eigene gespeicherte Prozeduren erstellen, um die Funktionalität zu erweitern und um einfacher mit von Vorhersageabfragen und Inhaltsabfragen zurückgegebenen Daten arbeiten zu können.You can create your own stored procedures to extend functionality and more easily work with data returned by prediction queries and content queries.

Definieren gespeicherter ProzedurenDefining Stored Procedures

Die folgenden gespeicherten Prozeduren werden zur Durchführung einer Kreuzvalidierung unterstützt.The following stored procedures are supported for use in performing cross-validation.

Data Mining-gespeicherte Prozeduren (Analysis Services – Data Mining)Data Mining Stored Procedures (Analysis Services - Data Mining)

Darüber hinaus enthält Analysis ServicesAnalysis Services viele gespeicherte Systemprozeduren, die intern für Data Mining verwendet werden.Additionally, Analysis ServicesAnalysis Services contains many system stored procedures that are used internally for data mining. Obwohl die gespeicherten Systemprozeduren für die interne Verwendung ausgelegt sind, können Sie Ihnen unter Umständen nützliche Verknüpfungen bieten.Although the system stored procedures are for internal use, you might find them useful shortcuts. Microsoft behält sich das Recht vor, diese gespeicherten Prozeduren je nach Bedarf zu ändern. Daher wird hinsichtlich einer produktiven Nutzung empfohlen, dass Sie Abfragen mit DMX, AMO oder XMLA erstellen.Microsoft reserves the right to change these stored procedures as needed; therefore, for production use, we recommend that you create queries by using DMX, AMO, or XMLA.

Benutzerdefinierte Plug-In-AlgorithmenCustom plug-in algorithms
Analysis ServicesAnalysis Servicesbietet einen Mechanismus zum Erstellen Ihrer eigenen Algorithmen und Hinzufügen von Algorithmen als eine neue Datamining-Dienst mit der Serverinstanz an. provides a mechanism for creating your own algorithms, and then adding the algorithms as a new data mining service to the server instance.

Analysis Services verwendet COM-Schnittstellen zum Kommunizieren mit den Plug-In-Algorithmen.Analysis Services uses COM interfaces to communicate with plugin algorithms. Weitere Informationen darüber, wie neue Algorithmen implementiert werden, finden Sie unter Plugin Algorithms.To learn more about how to implement new algorithms, see Plugin Algorithms.

Sie müssen jeden neuen Algorithmus registrieren, bevor Sie diesen verwenden können.You must register each new algorithm before you can use it. Um einen Algorithmus zu registrieren, fügen Sie die erforderlichen Metadaten für den jeweiligen Algorithmus in der INI-Datei der Instanz von Analysis ServicesAnalysis Serviceshinzu.To register an algorithm, you add the required metadata for the algorithms in the .ini file of the instance of Analysis ServicesAnalysis Services. Sie müssen jeder Instanz, bei der Sie die Verwendung des entsprechenden Algorithmus beabsichtigen, diese Informationen hinzufügen.You must add the information to each instance where you plan to use the new algorithm. Nachdem Sie den Algorithmus hinzugefügt haben, können Sie die Instanz neu starten. Sie können das MINING_SERVICES-Schemarowset verwenden, um den neuen Algorithmus anzuzeigen, einschließlich der Optionen und Anbieter, welche der Algorithmus unterstützt.After you have added the algorithm, you can restart the instance, and use the MINING_SERVICES schema rowset to view the new algorithm, including the options and providers that the algorithm supports.

Weitere Informationen finden Sie unterSee Also

Verarbeiten eines mehrdimensionalen Modells (Analysis Services) Processing a multidimensional model (Analysis Services)
Data Mining-Erweiterungen (DMX) – ReferenzData Mining Extensions (DMX) Reference