MicrosoftML (R-Bibliothek in SQL Server)MicrosoftML (R library in SQL Server)

Gilt für: JaSQL Server NeinAzure SQL-Datenbank NeinAzure Synapse Analytics (SQL DW) NeinParallel Data Warehouse APPLIES TO: yesSQL Server noAzure SQL Database noAzure Synapse Analytics (SQL DW) noParallel Data Warehouse

MicrosoftML ist eine R-Funktionsbibliothek von Microsoft, die leistungsstarke Machine Learning-Algorithmen bereitstellt.MicrosoftML is an R function library from Microsoft providing high-performance machine learning algorithms. Sie enthält Funktionen für Training, Transformationen, Bewertung, Text- und Bildanalyse sowie Featureextraktion zum Ableiten von Werten aus vorhandenen Daten.It includes functions for training and transformations, scoring, text and image analysis, and feature extraction for deriving values from existing data.

Die Machine Learning-APIs wurden von Microsoft für interne Machine Learning-Anwendungen entwickelt und im Laufe der Jahre so optimiert, dass sie bei Big Data eine hohe Leistung durch Verarbeitung auf Mehrkernprozessoren und schnelles Datenstreaming unterstützen.The machine learning APIs were developed by Microsoft for internal machine learning applications, and have been refined over the years to support high performance on big data, using multicore processing and fast data streaming. MicrosoftML enthält auch zahlreiche Transformationen für die Text- und Bildverarbeitung.MicrosoftML also includes numerous transformations for text and image processing.

Vollständige ReferenzdokumentationFull reference documentation

Die MicrosoftML-Bibliothek wird in mehreren Microsoft-Produkten bereitgestellt. Die Verwendung ist jedoch immer identisch, unabhängig davon, ob Sie die Bibliothek in SQL Server oder einem anderen Produkt abrufen.The MicrosoftML library is distributed in multiple Microsoft products, but usage is the same whether you get the library in SQL Server or another product. Aus diesem Grund wird die Dokumentation für einzelne RevoScaleR-Funktionen nur an einer Stelle in der R-Referenz für Microsoft Machine Learning Server veröffentlicht.Because the functions are the same, documentation for individual RevoScaleR functions is published to just one location under the R reference for Microsoft Machine Learning Server. Abweichungen durch produktspezifisches Verhalten finden Sie ggf. auf der Hilfeseite der Funktion.Should any product-specific behaviors exist, discrepancies will be noted in the function help page.

Versionen und PlattformenVersions and platforms

Die MicrosoftML-Bibliothek basiert auf R 3.4.3 und ist nur verfügbar, wenn Sie eines der folgenden Microsoft-Produkte oder Downloads installieren:The MicrosoftML library is based on R 3.4.3 and available only when you install one of the following Microsoft products or downloads:

Hinweis

Vollständige Produktversionen sind in SQL Server 2017 nur unter Windows verfügbar.Full product release versions are Windows-only in SQL Server 2017. In SQL Server 2019 wird MicrosoftML sowohl unter Windows als auch unter Linux unterstützt.Both Windows and Linux are supported for MicrosoftML in SQL Server 2019.

PaketabhängigkeitenPackage dependencies

Die Algorithmen folgender Elemente hängen in MicrosoftML von RevoScaleR ab:Algorithms in MicrosoftML depend on RevoScaleR for:

  • Datenquellenobjekte:Data source objects. Die von MicrosoftML-Funktionen genutzten Daten werden mithilfe von RevoScaleR-Funktionen erstellt.Data consumed by MicrosoftML functions are created using RevoScaleR functions.
  • Remotecomputing (das Verschieben der Funktionsausführung in eine SQL Server-Remoteinstanz):Remote computing (shifting function execution to a remote SQL Server instance). Die RevoScaleR-Bibliothek stellt Funktionen zum Erstellen und Aktivieren eines Remotecomputekontexts für SQL Server bereit.The RevoScaleR library provides functions for creating and activating a remote compute context for SQL server.

In den meisten Fällen werden die Pakete bei der Verwendung von MicrosoftML zusammen geladen.In most cases, you will load the packages together whenever you are using MicrosoftML.

Funktionen nach KategorieFunctions by category

In diesem Abschnitt werden die Funktionen nach Kategorien aufgelistet, damit Sie einen Überblick über die Verwendung der einzelnen Funktionen erhalten.This section lists the functions by category to give you an idea of how each one is used. Im Inhaltsverzeichnis können Sie in alphabetischer Reihenfolge nach den Funktionen suchen.You can also use the table of contents to find functions in alphabetical order.

1: Machine Learning-Algorithmen1-Machine learning algorithms

FunktionsnameFunction name BeschreibungDescription
rxFastTreesrxFastTrees Implementierung von FastRank, effiziente Implementierung des Gradient Boosting-MART-Algorithmus.An implementation of FastRank, an efficient implementation of the MART gradient boosting algorithm.
rxFastForestrxFastForest Implementierung der zufälligen Gesamtstruktur und der Gesamtstruktur nach Quantilregression mit rxFastTrees.A random forest and Quantile regression forest implementation using rxFastTrees.
rxLogisticRegressionrxLogisticRegression Logistische Regression mit L-BFGS.Logistic regression using L-BFGS.
rxOneClassSvmrxOneClassSvm Einklassige Support Vector Machine.One class support vector machines.
rxNeuralNetrxNeuralNet Binäres, mehrklassiges und neuronales Regressionsnetzwerk.Binary, multi-class, and regression neural net.
rxFastLinearrxFastLinear Optimierung des doppelten stochastischen Koordinatenanstiegs für die lineare binäre Klassifizierung und Regression.Stochastic dual coordinate ascent optimization for linear binary classification and regression.
rxEnsemblerxEnsemble Trainiert eine Reihe von verschiedenen Modellen zur Steigerung der Vorhersageleistung im Vergleich zu einem einzelnen Modell.Trains a number of models of various kinds to obtain better predictive performance than could be obtained from a single model.

2: Transformationsfunktionen2-Transformation functions

FunktionsnameFunction name BeschreibungDescription
concatconcat Erstellt eine Spalte mit einem einzelnen Vektorwert aus mehreren Spalten.Transformation to create a single vector-valued column from multiple columns.
categoricalcategorical Erstellt einen Indikatorvektor durch Kategorietransformation mit einem Wörterbuch.Create indicator vector using categorical transform with dictionary.
categoricalHashcategoricalHash Konvertiert den Kategoriewert durch einen Hashvorgang in ein Indikatorarray.Converts the categorical value into an indicator array by hashing.
featurizeTextfeaturizeText Erstellt aus einem angegebenen Textkorpus einen Behälter mit der Anzahl von Sequenzen aus aufeinander folgenden Wörtern (sogenannten N-Grammen).Produces a bag of counts of sequences of consecutive words, called n-grams, from a given corpus of text. Enthält Spracherkennung, Tokenisierung, das Entfernen von Stoppwörtern, Textnormalisierung und Featuregenerierung.It offers language detection, tokenization, stopwords removing, text normalization and feature generation.
getSentimentgetSentiment Bewertet Text in natürlicher Sprache und erstellt eine Spalte mit Wahrscheinlichkeiten, dass die Stimmung im Text positiv ist.Scores natural language text and creates a column that contains probabilities that the sentiments in the text are positive.
ngramngram Ermöglicht das Definieren von Argumenten für die anzahl- und hashbasierte Featureextraktion.allows defining arguments for count-based and hash-based feature extraction.
selectColumnsselectColumns Wählt mehrere Spalten aus, die erneut trainiert werden sollen, und löscht alle anderen Spalten.Selects a set of columns to retrain, dropping all others.
selectFeaturesselectFeatures Wählt unter Verwendung eines angegebenen Modus Funktionen aus den angegebenen Variablen aus.Selects features from the specified variables using a specified mode.
loadImageloadImage Lädt Bilddaten.Loads image data.
resizeImageresizeImage Ändert die Größe eines Bilds in eine angegebene Größe unter Verwendung einer angegebenen Methode zur Größenänderung.Resizes an image to a specified dimension using a specified resizing method.
extractPixelsextractPixels Extrahiert die Pixelwerte aus einem Bild.Extracts the pixel values from an image.
featurizeImagefeaturizeImage Erstellt mithilfe eines vortrainierten tiefen neuronalen Netzwerkmodells Merkmale für ein Bild.Featurizes an image using a pre-trained deep neural network model.

3: Bewertungs- und Trainingsfunktionen3-Scoring and training functions

FunktionsnameFunction name BeschreibungDescription
rxPredict.mlModelrxPredict.mlModel Führt die Bewertungsbibliothek entweder in SQL Server mithilfe der gespeicherten Prozedur oder über R-Code aus, um eine Echtzeitbewertung und dadurch eine wesentlich schnellere Vorhersageleistung zu erzielen.Runs the scoring library either from SQL Server, using the stored procedure, or from R code enabling real-time scoring to provide much faster prediction performance.
rxFeaturizerxFeaturize Wandelt Daten von einem Eingabedataset in ein Ausgabedataset um.Transforms data from an input data set to an output data set.
mlModelmlModel Stellt die Zusammenfassung eines Microsoft Machine Learning-Modells für R bereit.Provides a summary of a Microsoft R Machine Learning model.

4: Verlustfunktionen zur Klassifizierung und Regression4-Loss functions for classification and regression

FunktionsnameFunction name BeschreibungDescription
expLossexpLoss Spezifikationen für eine Verlustfunktion für exponentielle Klassifizierungen.Specifications for exponential classification loss function.
logLosslogLoss Spezifikationen für eine Verlustfunktion für Protokollklassifizierungen.Specifications for log classification loss function.
hingeLosshingeLoss Spezifikationen für eine Verlustfunktion für Scharnierklassifizierungen.Specifications for hinge classification loss function.
smoothHingeLosssmoothHingeLoss Spezifikationen für eine Verlustfunktion für geglättete Scharnierklassifizierungen.Specifications for smooth hinge classification loss function.
poissonLosspoissonLoss Spezifikationen für eine Verlustfunktion für Poisson-Regressionen.Specifications for poisson regression loss function.
squaredLosssquaredLoss Spezifikationen für eine Verlustfunktion für quadratische Regressionen.Specifications for squared regression loss function.

5: Funktionsauswahlfunktionen5-Feature selection functions

FunktionsnameFunction name BeschreibungDescription
minCountminCount Spezifikation für die Funktionsauswahl im Anzahlmodus.Specification for feature selection in count mode.
mutualInformationmutualInformation Spezifikation für die Funktionsauswahl im Transinformationsmodus.Specification for feature selection in mutual information mode.

6: Ensemble-Modellierungsfunktionen6-Ensemble modeling functions

FunktionsnameFunction name BeschreibungDescription
fastTreesfastTrees Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen Strukturmodells mit rxEnsemble.Creates a list containing the function name and arguments to train a Fast Tree model with rxEnsemble.
fastForestfastForest Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen Gesamtstrukturmodells mit rxEnsemble.Creates a list containing the function name and arguments to train a Fast Forest model with rxEnsemble.
fastLinearfastLinear Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines schnellen linearen Modells mit rxEnsemble.Creates a list containing the function name and arguments to train a Fast Linear model with rxEnsemble.
logisticRegressionlogisticRegression Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines logistischen Regressionsmodells mit rxEnsemble.Creates a list containing the function name and arguments to train a Logistic Regression model with rxEnsemble.
oneClassSvmoneClassSvm Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines OneClassSvm-Modells mit rxEnsemble.Creates a list containing the function name and arguments to train a OneClassSvm model with rxEnsemble.

7: Neuronale Netzwerkfunktionen7-Neural networking functions

FunktionsnameFunction name BeschreibungDescription
optimizeroptimizer Gibt Optimierungsalgorithmen für den Machine Learning-Algorithmus rxNeuralNet an.Specifies optimization algorithms for the rxNeuralNet machine learning algorithm.

8: Paketstatusfunktionen8-Package state functions

FunktionsnameFunction name BeschreibungDescription
rxHashEnvrxHashEnv Umgebungsobjekt zum Speichern des paketweiten Status.An environment object used to store package-wide state.

Verwendung von MicrosoftMLHow to use MicrosoftML

Funktionen in MicrosoftML können in R-Code aufgerufen werden, der in gespeicherten Prozeduren gekapselt ist.Functions in MicrosoftML are callable in R code encapsulated in stored procedures. Die meisten Entwickler erstellen MicrosoftML-Lösungen lokal, und migrieren den fertigen R-Code anschließend als Bereitstellungsübung in gespeicherte Prozeduren.Most developers build MicrosoftML solutions locally, and then migrate finished R code to stored procedures as a deployment exercise.

Das MicrosoftML-Paket für R ist in SQL Server 2017 bereits installiert.The MicrosoftML package for R is installed "out-of-the-box" in SQL Server 2017. Es ist auch für SQL Server 2016 verfügbar, wenn Sie die R-Komponenten für die Instanz aktualisieren: Aktualisieren einer Instanz von SQL Server mithilfe von Bindung.It is also available for use with SQL Server 2016 if you upgrade the R components for the instance: Upgrade an instance of SQL Server using binding

Das Paket wird nicht standardmäßig geladen.The package is not loaded by default. Laden Sie zunächst das MicrosoftML-Paket und anschließend RevoScaleR, wenn Sie Remotecomputekontexte oder verbundene Verbindungs- oder Datenquellenobjekte verwenden müssen.As a first step, load the MicrosoftML package, and then load RevoScaleR if you need to use remote compute contexts or related connectivity or data source objects. Verweisen Sie dann auf die einzelnen Funktionen, die Sie benötigen.Then, reference the individual functions you need.

library(microsoftml);
library(RevoScaleR);
logisticRegression(args);

Weitere InformationenSee also