Data Mining-Assistent (Analysis Services - Data Mining)Data Mining Wizard (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesData Mining-Assistenten in MicrosoftMicrosoft SQL ServerSQL Server Analysis ServicesAnalysis Services beginnt jedes Mal, wenn Sie ein Datamining-Projekt eine neue Miningstruktur hinzufügen. The Data Mining Wizard in MicrosoftMicrosoft SQL ServerSQL Server Analysis ServicesAnalysis Services starts every time that you add a new mining structure to a data mining project. Der Assistent hilft Ihnen, eine Datenquelle auszuwählen und eine Datenquellenansicht einzurichten, mit der die für die Analyse verwendeten Daten definiert werden. Anschließend hilft er Ihnen, ein erstes Modell zu erstellen.The wizard helps you choose a data source and set up a data source view that defines the data to be used for analysis, and then helps you create an initial model.

In der abschließenden Phase des Assistenten können Sie die Daten optional in Training und Testsätze unterteilen und Funktionen wie Drillthrough aktivieren.In the final phase of the wizard, you can optionally divide your data into training and testing sets, and enable features such as drillthrough.

Wissenswertes vor dem StartWhat to Know Before You Start

Die folgenden Dinge sollten Sie wissen, bevor Sie den Assistenten starten.Here are the things you need to know before you start the wizard.

  • Werden die Data Mining-Struktur und die -Modelle von einer relationalen Datenbank aus oder von einem vorhandenen Cube in einer OLAP-Datenbank erstellt?Will you build the data mining structure and models from a relational database or from an existing cube in an OLAP database?

  • Welche Spalten enthalten die Schlüssel, die einen Falldatensatz eindeutig identifizieren?Which columns contain the keys that uniquely identify a case record?

  • Welche Spalten oder Attribute möchten Sie für die Vorhersage verwenden?Which columns or attributes do you want to use for prediction? Welche Spalten oder Attribute sind als Eingabe für die Analyse gut geeignet?Which columns or attributes are good to use as input for analysis?

  • Welchen Algorithmus sollten Sie verwenden?Which algorithm should you use? Die in SQL ServerSQL Server Analysis ServicesAnalysis Services bereitgestellten Algorithmen haben unterschiedliche Eigenschaften und erzeugen verschiedene Ergebnisse.The algorithms provided in SQL ServerSQL Server Analysis ServicesAnalysis Services all have different characteristics and produce different results. Glücklicherweise sind Sie nicht auf ein Modell für alle Datensätze beschränkt, Sie können daher nach Bedarf verschiedene Modelle hinzufügen.Fortunately you are not limited to one model for each set of data, so feel free to experiment by adding different models.

  • Müssen Sie in der Lage sein, die Modelle auf einem einheitlichen Dataset zu testen?Do you need to be able to test your models on a unified data set? In diesem Fall erwägen Sie, die Option zu verwenden, um einige Daten für Tests zu reservieren.If so, consider using the option to set some data aside for testing. Sie können einen Prozentsatz auswählen und diesen bei Bedarf durch eine angegebene Anzahl von Zeilen nach oben begrenzen.You can choose a percentage, and cap that by a specified number of rows if desired.

Starten des Data Mining-AssistentenStarting the Data Mining Wizard

Es muss eine Projektmappe in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) geöffnet sein, die mindestens ein Data Mining- oder OLAP-Projekt enthält, um den Data Mining-Assistenten verwenden zu können.To use the Data Mining Wizard, you must have opened a solution in SQL Server Data Tools (SSDT)SQL Server Data Tools (SSDT) that contains at least one data mining or OLAP project.

  • Wenn die Projektmappe für Data Mining bereit ist, können Sie im Projektmappen-Explorer einfach mit der rechten Maustaste auf den Knoten Miningstrukturen klicken und Neue Miningstruktur auswählen, um den Assistenten zu starten.If your solution is ready for data mining, you can simply right-click the Mining Structures node in Solution Explorer and select New Mining Structure to start the wizard.

  • Wenn die Projektmappe keine vorhandenen Projekte enthält, können Sie ein neues Data Mining-Projekt hinzufügen.If your solution does not contain any existing projects, you can add a new data mining project. Wählen Sie im Menü Datei die Option Neuaus, und klicken Sie dann auf Projekt.From the File menu, select New, and then select Project. Wählen Sie die Vorlage für multidimensionale Projekte bzw. Data Mining-Projekte von Analysis Services aus.Be sure to choose the template, Analysis Services Multidimensional and Data Mining Project.

  • Sie können auch Metadaten aus einer vorhandenen Data Mining-Projektmappe mithilfe des Analysis Services-Import-Assistenten abrufen.You can also use the Analysis Services Import Wizard to obtain metadata from an existing data mining solution. Sie können jedoch die zu importierenden einzelnen Objekte nicht auswählen. Die gesamte Datenbank wird importiert, und zwar einschließlich sämtlicher Cubes, Datenquellensichten usw. Die durch den Import neu erstellte Projektmappe wird automatisch so konfiguriert, dass sie die lokale Standarddatenbank verwendet.However, you cannot select the individual objects to import; the entire database is imported, including any cubes, data source views, etc. Also note that the new solution that is created via import is automatically configured to use the local default database. Sie müssen dies möglicherweise in eine andere Instanz ändern, bevor Sie die Objekte verarbeiten oder durchsuchen können. Wenn Sie aus einer früheren Version von Analysis ServicesAnalysis Servicesimportieren, müssen Sie die Verweise auf Anbieter möglicherweise aktualisieren.You might need to change this to another instance before you can process or browse the objects, and if you are importing from a previous version of Analysis ServicesAnalysis Services, you might need to update references to providers.

    Anschließend müssen Sie die Miningstruktur und ein zugeordnetes Data Mining-Modell erstellen.Next, you will create the mining structure and one associated data mining model. Sie können auch nur die Miningstruktur erstellen und später Modelle hinzufügen. Es ist jedoch im Allgemeinen am einfachsten, zuerst ein Testmodell zu erstellen.You can also create just the mining structure and add models later, but it is generally easiest to create a test model first.

Vergleich der relationalen und OLAP-MiningmodelleRelational vs. OLAP Mining Models

Sie sollten sich entscheiden, ob Sie eine relationale Datenquelle verwenden oder ob Ihr Modell auf multidimensionalen Daten (OLAP) basieren soll.The next important option that you have is whether to use a relational data source, or to base your model on multidimensional (OLAP) data.

Im Data Mining-Assistenten gibt es an dieser Stelle zwei Möglichkeiten, je nachdem, ob Ihre Datenquelle relational oder in einem Cube ist:The Data Mining Wizard branches into two paths at this point, depending on whether your data source is relational or in a cube. Abgesehen vom Datenauswahlprozess ist alles andere gleich – die Auswahl des Algorithmus, die Möglichkeit, ein Dataset mit zurückgehaltenen Daten hinzuzufügen usw. Die Auswahl der Cubedaten ist jedoch ein wenig komplexer als die Verwendung von relationalen Daten.Everything else except the data selection process is the same—the choice of algorithm, the ability to add a holdout data set, etc.—but selecting cube data is a bit more complex than using relational data. (Sie erhalten am Ende auch einige zusätzliche Optionen, wenn Sie ein Modell auf Grundlage eines Cubes erstellen.)(You also get some additional options at the end if you create a model based on a cube.)

Eine detaillierte exemplarische Vorgehensweise jeder Option finden Sie in den folgenden Themen:See the following topics for a walkthrough of each option in more detail:

Erstellen einer relationalen MiningstrukturCreate a Relational Mining Structure
Hilft Ihnen bei der Entscheidungsfindung, wenn Sie ein relationales Data Mining-Modell erstellen.Walks you through the decisions you make when building a relational data mining model.

Erstellen einer OLAP-MiningstrukturCreate an OLAP Mining Structure
Beschreibt die zusätzlichen Optionen und die Auswahlmöglichkeiten, wenn Daten von einem OLAP-Cube ausgewählt werden.Describes the additional options and selections to make when choosing data from an OLAP cube.

Hinweis

Für ein Data Mining ist es nicht erforderlich, dass Sie einen Cube oder eine OLAP-Datenbank haben.You do not need to have a cube or an OLAP database to do data mining. Sofern Ihre Daten nicht bereits in einem Cube gespeichert sind oder Sie OLAP-Dimensionen oder die Ergebnisse von OLAP-Aggregationen oder -Berechnungen auswerten möchten, empfehlen wir die Verwendung einer relationalen Tabelle oder Datenquelle für das Data Mining.Unless your data is already stored in a cube, or you want to mine OLAP dimensions or the results of OLAP aggregations or calculations, we recommend that you use a relational table or data source for data mining.

Auswählen eines AlgorithmusChoosing an Algorithm

Anschließend müssen Sie sich entscheiden, welcher Algorithmus für die Verarbeitung Ihrer Daten verwendet werden soll.Next, you must decide on which algorithm to use in processing your data. Es kann schwierig sein, eine Entscheidung zu treffen.This decision can be difficult to make. Jeder in Analysis ServicesAnalysis Services bereitgestellte Algorithmus verfügt über unterschiedliche Funktionen und führt zu unterschiedlichen Ergebnissen. Sie können experimentieren und verschiedene Modelle ausprobieren, bevor Sie das angemessenste Modell für Ihre Daten und Ihr Geschäftsproblem bestimmen.Each algorithm provided in Analysis ServicesAnalysis Services has different features and produces different results, so you can experiment and try several different models before determining which is most appropriate for your data and your business problem. Im folgenden Thema finden Sie eine Erklärung der Aufgaben, für die jeder Algorithmus am besten geeignet ist.See the following topic for an explanation of the tasks to which each algorithm is best suited:

Data Mining-Algorithmen (Analysis Services – Data Mining)Data Mining Algorithms (Analysis Services - Data Mining)

Sie können mehrere Modelle mit unterschiedlichen Algorithmen erstellen oder die Parameter der Algorithmen ändern, um verschiedene Modelle zu erstellen.Again, you can create multiple models using different algorithms, or change parameters for the algorithms to create different models. Sie werden in Bezug auf die Auswahl des Algorithmus nicht eingeschränkt, und es ist eine gute Übung, um mehrere unterschiedliche Modelle für die gleichen Daten zu erstellen.You are not locked into your choice of algorithm, and it is good practice to create several different models on the same data.

Definieren der für Modellierung verwendeten DatenDefine the Data Used for Modeling

Zusätzlich zur Auswahl der Daten von einer Quelle müssen Sie angeben, welche der Tabellen in der Datenquellensicht die Falldatenenthält.In addition to choosing the data from a source, you must specify which of the table in the data source view contains the case data. Die Falltabelle wird verwendet, um das Data Mining-Modell zu erlernen. Sie sollte die zu analysierenden Entitäten enthalten, beispielsweise Kunden und deren demografische Informationen.The case table will be used to train the data mining model, and as such should contain the entities that you want to analyze: for example, customers and their demographic information. Jeder Fall muss eindeutig sein und durch einen Fallschlüsselidentifizierbar sein.Each case must be unique, and must be identifiable by a case key.

Zusätzlich zum Bestimmen der Falltabelle können Sie geschachtelte Tabellen in die Daten einbeziehen.In addition to specifying the case table, you can include nested tables in your data. Eine geschachtelte Tabelle enthält in der Regel zusätzliche Informationen zu den Entitäten in der Falltabelle, etwa von dem Kunden vorgenommene Transaktionen oder Attribute, die eine n:1-Beziehung zu der Entität aufweisen.A nested table usually contains additional information about the entities in the case table, such as transactions conducted by the customer, or attributes that have a many-to-one relationship with the entity. Eine mit der Falltabelle Kunden verknüpfte geschachtelte Tabelle könnte beispielsweise eine Liste der von jedem Kunden erworbenen Produkte enthalten.For example, a nested table joined to the Customers case table might include a list of products purchased by each customer. In einem Modell, das Datenverkehr zu einer Website analysiert, könnte die geschachtelte Tabelle die Sequenzen von Seiten enthalten, die der Benutzer besucht hat.In a model that analyzes traffic to a Web site, the nested table might include the sequences of pages that the user visited. Weitere Informationen finden Sie unter Geschachtelte Tabellen (Analysis Services – Data Mining).For more information, see Nested Tables (Analysis Services - Data Mining)

Zusätzliche FunktionenAdditional Features

Vom Data Mining-Assistenten werden diese zusätzlichen Funktionen bereitgestellt, um Ihnen dabei zu helfen, die richtigen Daten auszuwählen und die Datenquellen ordnungsgemäß zu konfigurieren:To assist you in choosing the right data, and configuring the data sources correctly, the Data Mining Wizard provides these additional features:

  • Automatische Erkennung von Datentypen:Der Assistent untersucht die Eindeutigkeit und die Verteilung von Spaltenwerten und empfiehlt anschließend den besten Datentyp sowie einen Verwendungstyp für die Daten.Auto -detection of data types: The wizard will examine the uniqueness and distribution of column values and then recommend the best data type, and suggest a usage type for the data. Sie können diese Vorschläge überschreiben, indem Sie Werte aus einer Liste auswählen.You can override these suggestions by selecting values from a list.

  • Vorschläge für Variablen: Sie können auf ein Dialogfeld klicken und einen Analyzer starten, der Korrelationen zwischen den in einem Modell einbezogenen Spalten berechnet und bestimmt, ob alle Spalten basierend auf der bisherigen Konfiguration des Modells wahrscheinliche Vorhersagen des Ausgabeattributs sind.Suggestions for variables: You can click on a dialog box and start an analyzer that calculates correlations across the columns included in the model, and determines whether any columns are likely predictors of the outcome attribute, given the configuration of the model so far. Sie können diese Vorschläge überschreiben, indem Sie andere Werte eingeben.You can override these suggestions by typing different values.

  • Funktionsauswahl: Von den meisten Algorithmen werden Spalten, die gute Indikatoren sind, automatisch erkannt und bevorzugt verwendet.Feature selection: Most algorithms will automatically detect columns that are good predictors and use those preferentially. Die Funktionsauswahl wird auf Spalten angewendet, die zu viele Werte enthalten, um die Kardinalität der Daten zu reduzieren und um die Chancen zu erhöhen, ein aussagekräftiges Muster zu finden.In columns that contain too many values, feature selection will be applied, to reduce the cardinality of the data and improve the chances for finding a meaningful pattern. Sie können das Verhalten der Funktionsauswahl beeinflussen, indem Sie Modellparameter verwenden.You can affect feature selection behavior by using model parameters.

  • Automatische Aufteilung des Cubes: Wenn das Miningmodell auf einer OLAP-Datenquelle basiert, besteht automatisch die Möglichkeit, das Modell mit Cubeattributen in Slices aufzuteilen.Automatic cube slicing: If your mining model is based on an OLAP data source, the ability to slice the model by using cube attributes is automatically provided. Dies ist praktisch, um Modelle auf Grundlage der Teilmengen von Cubedaten zu erstellen.This is handy for crating models based on subsets of cube data.

Abschließen des AssistentenCompleting the Wizard

Der letzte Schritt im Assistenten besteht aus der Benennung der Miningstruktur und dem damit verbundenen Miningmodell.The last step in the wizard is to name the mining structure and the associated mining model. Je nachdem welchen Modelltyp Sie erstellt haben, stehen Ihnen die folgenden wichtigen Optionen zur Verfügung;Depending on the type of model you created, you might also have the following important options:

  • Wenn Sie Drillthrough zulassenauswählen, wird die Möglichkeit zum Drillthrough im Modell aktiviert.If you select Allow drill through, the ability to drill through is enabled in the model. Mit Drillthrough können Benutzer, die die entsprechenden Berechtigungen haben, die Quelldaten analysieren, die beim Erstellen des Modells verwendet wurden.With drillthrough, users who have the appropriate permissions can explore the source data that is used to build the model.

  • Wenn Sie ein OLAP-Modell erstellen, können Sie die Option Neuen Data Mining-Cube erstellenoder Data Mining-Dimension erstellenauswählen.If you are building an OLAP model, you can select the options, Create a new data mining cube, or Create a data mining dimension. Die beiden Optionen erleichtern es, das fertige Modell zu durchsuchen und einen Drillthrough auf die zugrunde liegenden Daten auszuführen.Both these options make it easier to browse the completed model and drill through to the underlying data.

    Nachdem Sie den Data Mining-Assistenten abgeschlossen haben, ändern Sie mit dem Data Mining-Designer die Miningstruktur und die -modelle, um die Genauigkeit des Modells sowie die Charakteristika der Struktur und der Modelle anzuzeigen, oder Vorhersagen mithilfe der Modelle durchzuführen.After you complete the Data Mining Wizard, you use Data Mining Designer to modify the mining structure and models, to view the accuracy of the model, view characteristics of the structure and models, or make predictions by using the models.

    Zurück zum AnfangBack to Top

Weitere Informationen über die nötigen Entscheidungen bei der Erstellung eines Data Mining-Modells sind den folgenden Links zu entnehmen:To learn more about the decisions you need to make when creating a data mining model, see the following links:

Data Mining-Algorithmen (Analysis Services – Data Mining)Data Mining Algorithms (Analysis Services - Data Mining)

Inhaltstypen (Data Mining)Content Types (Data Mining)

Datentypen (Data Mining)Data Types (Data Mining)

Funktionsauswahl (Data Mining)Feature Selection (Data Mining)

Fehlende Werte (Analysis Services – Data Mining)Missing Values (Analysis Services - Data Mining)

Miningmodell-DrillthroughDrillthrough on Mining Models

Siehe auchSee Also

Data Mining-Tools Data Mining Tools
Data Mining-ProjektmappenData Mining Solutions