Data Mining-Algorithmen (Analysis Services - Data Mining)Data Mining Algorithms (Analysis Services - Data Mining)

GILT FÜR:JaSQL Server Analysis ServicesNeinAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesEin Algorithmus in Data Mining (oder Machine Learning) ist eine Reihe von Heuristiken und Berechnungen, die ein Modell aus Daten erstellt. An algorithm in data mining (or machine learning) is a set of heuristics and calculations that creates a model from data. Um ein Modell zu erstellen, werden vom Algorithmus zuerst die von Ihnen bereitgestellten Daten analysiert und bestimmte Muster oder Trends gesucht.To create a model, the algorithm first analyzes the data you provide, looking for specific types of patterns or trends. Mithilfe der Ergebnisse dieser Analyse über zahlreiche Iterationen definiert der Algorithmus die optimalen Parameter zum Erstellen des Miningmodells.The algorithm uses the results of this analysis over many iterations to find the optimal parameters for creating the mining model. Diese Parameter werden dann für das gesamte Dataset übernommen, um aussagefähige Muster und ausführliche Statistiken zu extrahieren.These parameters are then applied across the entire data set to extract actionable patterns and detailed statistics.

Das von einem Algorithmus aus Ihren Daten erstellte Miningmodell kann verschiedene Formen annehmen, einschließlich der folgenden:The mining model that an algorithm creates from your data can take various forms, including:

  • Eine Reihe von Clustern, die die Beziehungen der Fälle in einem Dataset beschreiben.A set of clusters that describe how the cases in a dataset are related.

  • Eine Entscheidungsstruktur, durch die ein Ergebnis vorhergesagt und beschrieben wird, wie sich unterschiedliche Kriterien auf dieses Ergebnis auswirken.A decision tree that predicts an outcome, and describes how different criteria affect that outcome.

  • Ein mathematisches Modell zum Vorhersagen von Umsätzen.A mathematical model that forecasts sales.

  • Eine Gruppe von Regeln, die beschreiben, wie Produkte in einer Transaktion gruppiert werden, und die Wahrscheinlichkeiten, dass Produkte zusammen gekauft werden.A set of rules that describe how products are grouped together in a transaction, and the probabilities that products are purchased together.

    Die in SQL ServerSQL Server Data Mining bereitgestellten Algorithmen sind die beliebtesten und am besten erforschten Methoden zum Ableiten von Mustern aus Daten.The algorithms provided in SQL ServerSQL Server Data Mining are the most popular, well-researched methods of deriving patterns from data. K-Means-Clustering ist z. B. einer der ältesten Clusteringalgorithmen, der in vielen verschiedenen Tools und mit vielen verschiedenen Implementierungen und Optionen zur Verfügung steht.To take one example, K-means clustering is one of the oldest clustering algorithms and is available widely in many different tools and with many different implementations and options. Die in SQL ServerSQL Server Data Mining verwendete spezifische Implementierung von K-Means-Clustering wurde allerdings von Microsoft Research entwickelt und anschließend für die Zusammenarbeit mit Analysis ServicesAnalysis Servicesoptimiert.However, the particular implementation of K-means clustering used in SQL ServerSQL Server Data Mining was developed by Microsoft Research and then optimized for performance with Analysis ServicesAnalysis Services. Alle Data Mining-Algorithmen von Microsoft können umfassend angepasst werden und sind mithilfe der bereitgestellten APIs vollständig programmierbar.All of the Microsoft data mining algorithms can be extensively customized and are fully programmable, using the provided APIs. Mithilfe der Data Mining-Komponenten in Integration ServicesIntegration Serviceskönnen Sie auch das Erstellen, Trainieren und erneute Trainieren von Modellen automatisieren.You can also automate the creation, training, and retraining of models by using the data mining components in Integration ServicesIntegration Services.

    Sie können auch Algorithmen von Drittanbietern verwenden, die der Spezifikation von OLE DB für Data Mining entsprechen, oder benutzerdefinierte Algorithmen entwickeln, die als Dienste registriert und dann innerhalb des SQL ServerSQL Server Data Mining-Frameworks verwendet werden können.You can also use third-party algorithms that comply with the OLE DB for Data Mining specification, or develop custom algorithms that can be registered as services and then used within the SQL ServerSQL Server Data Mining framework.

Auswählen des richtigen AlgorithmusChoosing the Right Algorithm

Es kann schwierig sein, den besten Algorithmus für einen bestimmten analytischen Task auszuwählen.Choosing the best algorithm to use for a specific analytical task can be a challenge. Während verschiedene Algorithmen zum Ausführen derselben Geschäftsaufgabe verwendet werden können, liefert jeder Algorithmus ein anderes Ergebnis, und einige Algorithmen können mehr als eine Ergebnisart ergeben.While you can use different algorithms to perform the same business task, each algorithm produces a different result, and some algorithms can produce more than one type of result. Sie können z. B. den MicrosoftMicrosoft Decision Trees-Algorithmus nicht nur für Vorhersagen verwenden, sondern auch als Möglichkeit, die Anzahl der Spalten in einem Dataset zu reduzieren, weil die Entscheidungsstruktur Spalten identifizieren kann, die sich nicht auf das endgültige Miningmodell auswirken.For example, you can use the MicrosoftMicrosoft Decision Trees algorithm not only for prediction, but also as a way to reduce the number of columns in a dataset, because the decision tree can identify columns that do not affect the final mining model.

Auswählen eines Algorithmus nach TypChoosing an Algorithm by Type

SQL ServerSQL Server Data Mining bietet die folgenden Algorithmentypen: Data Mining includes the following algorithm types:

  • Klassifikationsalgorithmen sagen basierend auf den anderen Attributen im Dataset mindestens eine diskrete Variable voraus.Classification algorithms predict one or more discrete variables, based on the other attributes in the dataset.

  • Regressionsalgorithmen sagen basierend auf anderen Attributen im Dataset mindestens eine kontinuierliche Variable voraus, z. B. den Gewinn oder Verlust.Regression algorithms predict one or more continuous numeric variables, such as profit or loss, based on other attributes in the dataset.

  • Segmentierungsalgorithmen teilen Daten in Gruppen oder Cluster aus Elementen auf, die ähnliche Eigenschaften haben.Segmentation algorithms divide data into groups, or clusters, of items that have similar properties.

  • Zuordnungsalgorithmen suchen nach Korrelationen zwischen verschiedenen Attributen in einem Dataset.Association algorithms find correlations between different attributes in a dataset. Die häufigste Anwendung dieser Algorithmusart besteht im Erstellen von Zuordnungsregeln, die für eine Warenkorbanalyse verwendet werden können.The most common application of this kind of algorithm is for creating association rules, which can be used in a market basket analysis.

  • Sequenzanalysealgorithmen fassen häufige Sequenzen oder Episoden in Daten zusammen, wie z. B. eine Reihe von Mausklicks auf einer Website oder eine Reihe von Protokollereignissen vor einer Computerwartung.Sequence analysis algorithms summarize frequent sequences or episodes in data, such as a series of clicks in a web site, or a series of log events preceding machine maintenance.

    Es gibt jedoch keinen Grund, sich in Projektmappen auf einen Algorithmus zu beschränken.However, there is no reason that you should be limited to one algorithm in your solutions. Erfahrene Analytiker verwenden manchmal einen Algorithmus, um die effizientesten Eingaben (d. h. Variablen) zu bestimmen, und wenden dann einen anderen Algorithmus an, um ein bestimmtes Ergebnis auf Grundlage dieser Daten vorherzusagen.Experienced analysts will sometimes use one algorithm to determine the most effective inputs (that is, variables), and then apply a different algorithm to predict a specific outcome based on that data. SQL ServerSQL Server Mithilfe von Data Mining können Sie mehrere Modelle für eine einzelne Miningstruktur erstellen. Daher können innerhalb einer einzelnen Data Mining-Projektmappe ein Clusteringalgorithmus, ein Entscheidungsstrukturmodell und ein Naïve Bayes-Modell verwendet werden, um unterschiedliche Sichten der Daten zu erhalten. Data Mining lets you build multiple models on a single mining structure, so within a single data mining solution you could use a clustering algorithm, a decision trees model, and a Naïve Bayes model to get different views on your data. Sie können mithilfe mehrerer Algorithmen in einer einzelnen Projektmappe auch separate Tasks ausführen: Beispielsweise können Sie mit dem Regressionsalgorithmus eine finanzielle Vorhersage generieren und mit dem Neural Network-Algorithmus die Faktoren analysieren, durch die Prognosen beeinflusst wird.You might also use multiple algorithms within a single solution to perform separate tasks: for example, you could use regression to obtain financial forecasts, and use a neural network algorithm to perform an analysis of factors that influence forecasts.

Auswählen eines Algorithmus nach TaskChoosing an Algorithm by Task

Um Ihnen die Auswahl eines Algorithmus für einen bestimmten Task zu erleichtern, ist in der folgende Tabelle angegeben, für welche Tasktypen die einzelnen Algorithmen üblicherweise verwendet werden.To help you select an algorithm for use with a specific task, the following table provides suggestions for the types of tasks for which each algorithm is traditionally used.

Beispiele für TasksExamples of tasks Microsoft-AlgorithmenMicrosoft algorithms to use
Vorhersagen eines diskreten Attributs:Predicting a discrete attribute:

Kennzeichnen von Kunden in einer Liste potenzieller Käufer als Kunden mit wahrscheinlicher oder unwahrscheinlicher Kaufabsicht.Flag the customers in a prospective buyers list as good or poor prospects.

Berechnen der Wahrscheinlichkeit, dass ein Server innerhalb der nächsten sechs Monate ausfällt.Calculate the probability that a server will fail within the next 6 months.

Kategorisieren von Therapieergebnissen und Untersuchen verwandter Faktoren.Categorize patient outcomes and explore related factors.
Microsoft Decision Trees-AlgorithmusMicrosoft Decision Trees Algorithm

Microsoft Naive Bayes-AlgorithmusMicrosoft Naive Bayes Algorithm

Microsoft Clustering-AlgorithmusMicrosoft Clustering Algorithm

Microsoft Neural Network-AlgorithmusMicrosoft Neural Network Algorithm
Vorhersagen eines kontinuierlichen Attributs:Predicting a continuous attribute:

Vorhersagen des Verkaufstrends für das nächste Jahr.Forecast next year's sales.

Vorhersagen von Websitebesuchern anhand historischer und saisonaler Trends.Predict site visitors given past historical and seasonal trends.

Generieren einer Risikobewertung anhand demografischer Daten.Generate a risk score given demographics.
Microsoft Decision Trees-AlgorithmusMicrosoft Decision Trees Algorithm

Microsoft Time Series-AlgorithmusMicrosoft Time Series Algorithm

Microsoft Linear Regression-AlgorithmusMicrosoft Linear Regression Algorithm
Vorhersagen einer Sequenz:Predicting a sequence:

Ausführen einer Clickstreamanalyse für eine Unternehmenswebsite.Perform clickstream analysis of a company's Web site.

Analysieren der Faktoren, die zu einem Serverausfall führen.Analyze the factors leading to server failure.

Aufzeichnen und Analysieren von Arbeitsabläufen während ambulanter Arztbesuche, um Best Practices für allgemeine Abläufe aufzustellen.Capture and analyze sequences of activities during outpatient visits, to formulate best practices around common activities.
Microsoft Sequence Clustering-AlgorithmusMicrosoft Sequence Clustering Algorithm
Suchen von Gruppen aus allgemeinen Elementen in Transaktionen:Finding groups of common items in transactions:

Bestimmen der Produktplatzierung mithilfe der Warenkorbanalyse.Use market basket analysis to determine product placement.

Vorschlagen zusätzlicher Produktkäufe für einen Kunden.Suggest additional products to a customer for purchase.

Analysieren einer Besucherumfrage zu einer Veranstaltung, um festzustellen, welche Aktivitäten oder Stände eine Korrelation aufweisen, und zukünftige Aktivitäten zu planen.Analyze survey data from visitors to an event, to find which activities or booths were correlated, to plan future activities.
Microsoft Association-AlgorithmusMicrosoft Association Algorithm

Microsoft Decision Trees-AlgorithmusMicrosoft Decision Trees Algorithm
Suchen von Gruppen mit ähnlichen Elementen:Finding groups of similar items:

Gruppieren von Patientenrisikoprofilen auf der Grundlage von Attributen wie demografischen oder Verhaltensdaten.Create patient risk profiles groups based on attributes such as demographics and behaviors.

Analysieren von Benutzern anhand von Browsing- und Kaufmustern.Analyze users by browsing and buying patterns.

Identifizieren von Servern mit ähnlichen Verwendungsmerkmalen.Identify servers that have similar usage characteristics.
Microsoft Clustering-AlgorithmusMicrosoft Clustering Algorithm

Microsoft Sequence Clustering-AlgorithmusMicrosoft Sequence Clustering Algorithm

Die folgende Tabelle enthält Links zu Schulungsressourcen für die einzelnen in SQL ServerSQL Server Data Mining bereitgestellten Data Mining-Algorithmen:The following table provides links to learning resources for each of the data mining algorithms that are provided in SQL ServerSQL Server Data Mining:

Grundlegende AlgorithmusbeschreibungBasic algorithm description Erläutert die Bedeutung und Funktionsweise des Algorithmus und zeigt mögliche Geschäftsszenarien auf, in denen der Algorithmus hilfreich sein könnte.Explains what the algorithm does and how it works, and outlines possible business scenarios where the algorithm might be useful.
Microsoft Association-AlgorithmusMicrosoft Association Algorithm

Microsoft Clustering-AlgorithmusMicrosoft Clustering Algorithm

Microsoft Decision Trees-AlgorithmusMicrosoft Decision Trees Algorithm

Microsoft Linear Regression-AlgorithmusMicrosoft Linear Regression Algorithm

Microsoft Logistic Regression-AlgorithmusMicrosoft Logistic Regression Algorithm

Microsoft Naive Bayes-AlgorithmusMicrosoft Naive Bayes Algorithm

Microsoft Neural Network-AlgorithmusMicrosoft Neural Network Algorithm

Microsoft Sequence Clustering-AlgorithmusMicrosoft Sequence Clustering Algorithm

Microsoft Time Series-AlgorithmusMicrosoft Time Series Algorithm
Technische ReferenzTechnical reference Stellt technische Details zur Implementierung des Algorithmus ggf. mit Verweisen auf wissenschaftliche Artikel bereit.Provides technical detail about the implementation of the algorithm, with academic references as necessary. Listet die Parameter auf, die Sie festlegen können, um das Verhalten des Algorithmus zu steuern und die Ergebnisse im Modell anzupassen.Lists the parameters that you can set to control the behavior of the algorithm and customize the results in the model. Beschreibt Datenanforderungen sowie Leistungstipps, falls möglich.Describes data requirements and provides performance tips if possible.
Technische Referenz für den Microsoft Association-AlgorithmusMicrosoft Association Algorithm Technical Reference

Technische Referenz für den Microsoft Clustering-AlgorithmusMicrosoft Clustering Algorithm Technical Reference

Technische Referenz für den Microsoft Decision Trees-AlgorithmusMicrosoft Decision Trees Algorithm Technical Reference

Technische Referenz für den Microsoft Linear Regression-AlgorithmusMicrosoft Linear Regression Algorithm Technical Reference

Technische Referenz für den Microsoft Logistic Regression-AlgorithmusMicrosoft Logistic Regression Algorithm Technical Reference

Technische Referenz für den Microsoft Naive Bayes-AlgorithmusMicrosoft Naive Bayes Algorithm Technical Reference

Technische Referenz für den Microsoft Neural Network-AlgorithmusMicrosoft Neural Network Algorithm Technical Reference

Technische Referenz für den Microsoft Sequence Clustering-AlgorithmusMicrosoft Sequence Clustering Algorithm Technical Reference

Technische Referenz für den Microsoft Time Series-AlgorithmusMicrosoft Time Series Algorithm Technical Reference
ModellinhaltModel content Beschreibt die Strukturierung der Informationen innerhalb der einzelnen Data Mining-Modelltypen und erläutert, wie die in den einzelnen Knoten gespeicherten Informationen interpretiert werden.Explains how information is structured within each type of data mining model, and explains how to interpret the information stored in each of the nodes.
Miningmodellinhalt von Zuordnungsmodellen (Analysis Services – Data Mining)Mining Model Content for Association Models (Analysis Services - Data Mining)

Miningmodellinhalt von Clustermodellen (Analysis Services - Data Mining)Mining Model Content for Clustering Models (Analysis Services - Data Mining)

Miningmodellinhalt von Entscheidungsstrukturmodellen (Analysis Services – Data Mining)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining)

Miningmodellinhalt von linearen Regressionsmodellen (Analysis Services – Data Mining)Mining Model Content for Linear Regression Models (Analysis Services - Data Mining)

Miningmodellinhalt von logistischen Regressionsmodellen (Analysis Services - Data Mining)Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining)

Miningmodellinhalt von Naive Bayes-Modellen (Analysis Services – Data Mining)Mining Model Content for Naive Bayes Models (Analysis Services - Data Mining)

Miningmodellinhalt von neuronalen Netzwerkmodellen (Analysis Services – Data Mining)Mining Model Content for Neural Network Models (Analysis Services - Data Mining)

Miningmodellinhalt von Sequence Clustering-Modellen (Analysis Services – Data Mining)Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining)

Miningmodellinhalt von Zeitreihenmodellen (Analysis Services – Data Mining)Mining Model Content for Time Series Models (Analysis Services - Data Mining)
Data Mining-AbfragenData mining queries Stellt mehrere Abfragen bereit, die mit jedem Modelltyp verwendet werden können.Provides multiple queries that you can use with each model type. Zu den Beispielen gehören Inhaltsabfragen, die Aufschluss über die im Modell enthaltenen Muster geben, und Vorhersageabfragen, die Sie beim Generieren von Vorhersagen auf Grundlage dieser Muster unterstützen.Examples include content queries that let you learn more about the patterns in the model, and prediction queries to help you build predictions based on those patterns.
Beispiele für ZuordnungsmodellabfragenAssociation Model Query Examples

Beispiele für ClusteringmodellabfragenClustering Model Query Examples

Beispiele für Entscheidungsstruktur-ModellabfragenDecision Trees Model Query Examples

Beispiele für lineare RegressionsmodellabfrageLinear Regression Model Query Examples

Logistische Regressionsmodell-AbfragebeispieleLogistic Regression Model Query Examples

Beispiele für Naive Bayes-ModellabfragenNaive Bayes Model Query Examples

Beispiele für Abfragen von neuronalen NetzwerkmodellenNeural Network Model Query Examples

Beispiele für Abfragen von SequenzclustermodellenSequence Clustering Model Query Examples

Abfragebeispiel ZeitreihenmodellTime Series Model Query Examples
ThemaTopic BeschreibungDescription
Bestimmen des von einem Data Mining-Modell verwendeten AlgorithmusDetermine the algorithm used by a data mining model Abfragen der für die Erstellung eines Miningmodell verwendeten ParameterQuery the Parameters Used to Create a Mining Model
Erstellen eines benutzerdefinierten Plug-In-AlgorithmusCreate a Custom Plug-In Algorithm Plug-In-AlgorithmenPlugin Algorithms
Durchsuchen eines Modells mit einem algorithmusspezifischen ViewerExplore a model using an algorithm-specific viewer Data Mining-Modell-ViewerData Mining Model Viewers
Anzeigen des Inhalts eines Modells unter Verwendung eines generischen TabellenformatsView the content of a model using a generic table format Durchsuchen eines Modells mit dem Microsoft Generic Content Tree ViewerBrowse a Model Using the Microsoft Generic Content Tree Viewer
Hier erfahren Sie, wie die Daten eingerichtet und Algorithmen zum Erstellen von Modellen verwendet werdenLearn about how to set up your data and use algorithms to create models Miningstrukturen (Analysis Services – Data Mining)Mining Structures (Analysis Services - Data Mining)

Miningmodelle (Analysis Services – Data Mining)Mining Models (Analysis Services - Data Mining)

Siehe auchSee Also

Data Mining-ToolsData Mining Tools