MicrosoftML (bibliothèque R dans SQL Server)MicrosoftML (R library in SQL Server)

S’APPLIQUE À : ouiSQL Server nonAzure SQL Database nonAzure Synapse Analytics (SQL DW) nonParallel Data Warehouse APPLIES TO: yesSQL Server noAzure SQL Database noAzure Synapse Analytics (SQL DW) noParallel Data Warehouse

MicrosoftML est une bibliothèque de fonctions R de Microsoft qui fournit des algorithmes de Machine Learning hautes performances.MicrosoftML is an R function library from Microsoft providing high-performance machine learning algorithms. Il comprend des fonctions d’apprentissage et de transformation, de scoring, d’analyse de texte et d’image, ainsi que d’extraction de caractéristiques pour dériver des valeurs à partir de données existantes.It includes functions for training and transformations, scoring, text and image analysis, and feature extraction for deriving values from existing data.

Les API de Machine Learning ont été développées par Microsoft pour les applications de Machine Learning internes et ont été affinées au fil des années pour fournir des performances élevées sur les Big Data, à l’aide du traitement multicœur et de la diffusion rapide des données.The machine learning APIs were developed by Microsoft for internal machine learning applications, and have been refined over the years to support high performance on big data, using multicore processing and fast data streaming. MicrosoftML comprend également de nombreuses transformations pour le traitement du texte et de l’image.MicrosoftML also includes numerous transformations for text and image processing.

Documentation de référence complèteFull reference documentation

La bibliothèque MicrosoftML est distribuée dans plusieurs produits Microsoft, mais l’utilisation est la même que vous obteniez la bibliothèque dans SQL Server ou un autre produit.The MicrosoftML library is distributed in multiple Microsoft products, but usage is the same whether you get the library in SQL Server or another product. Étant donné que les fonctions sont les mêmes, la documentation de chaque fonction RevoScaleR est publiée au même endroit sous la référence R pour Microsoft Machine Learning Server.Because the functions are the same, documentation for individual RevoScaleR functions is published to just one location under the R reference for Microsoft Machine Learning Server. Si des comportements spécifiques à un produit existent, les différences seront signalées dans la page d’aide de la fonction.Should any product-specific behaviors exist, discrepancies will be noted in the function help page.

Versions et plateformesVersions and platforms

La bibliothèque MicrosoftML est basée sur R 3.4.3 et n’est disponible que lorsque vous installez l’un des produits ou téléchargements Microsoft suivants :The MicrosoftML library is based on R 3.4.3 and available only when you install one of the following Microsoft products or downloads:

Notes

Les versions complètes du produit sont uniquement disponibles sous Windows dans SQL Server 2017.Full product release versions are Windows-only in SQL Server 2017. Windows et Linux sont pris en charge pour MicrosoftML dans SQL Server 2019.Both Windows and Linux are supported for MicrosoftML in SQL Server 2019.

Dépendances de packagePackage dependencies

Les algorithmes dans MicrosoftML dépendent de RevoScaleR pour :Algorithms in MicrosoftML depend on RevoScaleR for:

  • Les objets sources de données.Data source objects. Les données consommées par les fonctions MicrosoftML sont créées à l’aide des fonctions RevoScaleR.Data consumed by MicrosoftML functions are created using RevoScaleR functions.
  • Le calcul à distance (le passage de l’exécution des fonctions vers une instance SQL Server distante).Remote computing (shifting function execution to a remote SQL Server instance). La bibliothèque RevoScaleR fournit des fonctions permettant de créer et d’activer un contexte de calcul distant pour SQL Server.The RevoScaleR library provides functions for creating and activating a remote compute context for SQL server.

Dans la plupart des cas, vous devez charger les packages ensemble chaque fois que vous utilisez MicrosoftML.In most cases, you will load the packages together whenever you are using MicrosoftML.

Fonctions par catégorieFunctions by category

Cette section répertorie les fonctions par catégorie pour vous donner une idée de la façon dont chacune d’elles est utilisée.This section lists the functions by category to give you an idea of how each one is used. Vous pouvez également utiliser la table des matières pour rechercher des fonctions dans l’ordre alphabétique.You can also use the table of contents to find functions in alphabetical order.

1-Nouveaux algorithmes de Machine Learning1-Machine learning algorithms

Nom de la fonctionFunction name DescriptionDescription
rxFastTreesrxFastTrees Implémentation de FastRank, une implémentation efficace de l’algorithme de boosting de gradient MART.An implementation of FastRank, an efficient implementation of the MART gradient boosting algorithm.
rxFastForestrxFastForest Implémentation de forêt aléatoire et de forêt de régression quantile utilisant rxFastTrees.A random forest and Quantile regression forest implementation using rxFastTrees.
rxLogisticRegressionrxLogisticRegression Régression logistique à l’aide de L-BFGS.Logistic regression using L-BFGS.
rxOneClassSvmrxOneClassSvm Machines à vecteurs de support à une classe.One class support vector machines.
rxNeuralNetrxNeuralNet Réseau neuronal binaire, multiclasse et de régression.Binary, multi-class, and regression neural net.
rxFastLinearrxFastLinear Optimisation de l’élévation stochastique à double coordonnée pour la régression et la classification binaire linéaire.Stochastic dual coordinate ascent optimization for linear binary classification and regression.
rxEnsemblerxEnsemble Effectuer l’apprentissage de différents types de modèles pour obtenir des performances prédictives supérieures à celles obtenues à partir d’un modèle unique.Trains a number of models of various kinds to obtain better predictive performance than could be obtained from a single model.

2-Fonctions de transformation2-Transformation functions

Nom de la fonctionFunction name DescriptionDescription
concatconcat Transformation permettant de créer une seule colonne à valeurs vectorielles à partir de plusieurs colonnes.Transformation to create a single vector-valued column from multiple columns.
categoricalcategorical Crée un vecteur d’indicateur à l’aide d’une transformation catégorielle avec un dictionnaire.Create indicator vector using categorical transform with dictionary.
categoricalHashcategoricalHash Convertit la valeur catégorielle en tableau d’indicateurs par hachage.Converts the categorical value into an indicator array by hashing.
featurizeTextfeaturizeText Génère un ensemble de nombres de séquences de mots consécutifs (appelées n-grams) à partir d’un corpus de texte donné.Produces a bag of counts of sequences of consecutive words, called n-grams, from a given corpus of text. Il permet de détecter la langue, de créer des jetons, de supprimer les mots vides, de normaliser du texte et de générer des fonctionnalités.It offers language detection, tokenization, stopwords removing, text normalization and feature generation.
getSentimentgetSentiment Génère un score pour du texte en langage naturel et crée une colonne comprenant les probabilités que les sentiments du texte soient positifs.Scores natural language text and creates a column that contains probabilities that the sentiments in the text are positive.
ngramngram Permet de définir des arguments pour les extractions de fonctionnalités basées sur le nombre et le hachage.allows defining arguments for count-based and hash-based feature extraction.
selectColumnsselectColumns Sélectionne un ensemble de colonnes à entraîner à nouveau et supprime toutes les autres.Selects a set of columns to retrain, dropping all others.
selectFeaturesselectFeatures Sélectionne des fonctionnalités à partir de variables spécifiées à l’aide d’un mode spécifié.Selects features from the specified variables using a specified mode.
loadImageloadImage Charge des données d’image.Loads image data.
resizeImageresizeImage Change la taille d’une image aux dimensions spécifiées à l’aide d’une méthode de redimensionnement spécifiée.Resizes an image to a specified dimension using a specified resizing method.
extractPixelsextractPixels Extrait les valeurs en pixels d’une image.Extracts the pixel values from an image.
featurizeImagefeaturizeImage Génère des fonctionnalités pour une image à l’aide d’un modèle de réseau neuronal profond pré-entraîné.Featurizes an image using a pre-trained deep neural network model.

3-Fonctions de scoring et d’apprentissage3-Scoring and training functions

Nom de la fonctionFunction name DescriptionDescription
rxPredict.mlModelrxPredict.mlModel Exécute la bibliothèque de scoring à partir de SQL Server à l’aide de la procédure stockée, ou à partir du code R en activant le scoring en temps réel, ce qui permet d’obtenir des performances de prédiction beaucoup plus rapides.Runs the scoring library either from SQL Server, using the stored procedure, or from R code enabling real-time scoring to provide much faster prediction performance.
rxFeaturizerxFeaturize Transforme les données d’un jeu de données d’entrée en jeu de données de sortie.Transforms data from an input data set to an output data set.
mlModelmlModel Fournit un résumé d’un modèle Machine Learning Microsoft R.Provides a summary of a Microsoft R Machine Learning model.

4-Fonctions de perte pour la régression et la classification4-Loss functions for classification and regression

Nom de la fonctionFunction name DescriptionDescription
expLossexpLoss Spécifications pour la fonction de perte de classification exponentielle.Specifications for exponential classification loss function.
logLosslogLoss Spécifications pour la fonction de perte de classification des journaux.Specifications for log classification loss function.
hingeLosshingeLoss Spécifications pour la fonction de perte de classification de marge maximale.Specifications for hinge classification loss function.
smoothHingeLosssmoothHingeLoss Spécifications pour la fonction de perte de classification de marge maximale régulière.Specifications for smooth hinge classification loss function.
poissonLosspoissonLoss Spécifications de la fonction de perte de régression de Poisson.Specifications for poisson regression loss function.
squaredLosssquaredLoss Spécifications de la fonction de perte de régression quadratique.Specifications for squared regression loss function.

5-Fonctions de sélection des fonctionnalités5-Feature selection functions

Nom de la fonctionFunction name DescriptionDescription
minCountminCount Spécification pour la sélection des fonctionnalités en mode de dénombrement.Specification for feature selection in count mode.
mutualInformationmutualInformation Spécification pour la sélection des fonctionnalités en mode Informations mutuelles.Specification for feature selection in mutual information mode.

6-Fonctions de modélisation d’ensembles6-Ensemble modeling functions

Nom de la fonctionFunction name DescriptionDescription
fastTreesfastTrees Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle d’arborescence rapide avec rxEnsemble.Creates a list containing the function name and arguments to train a Fast Tree model with rxEnsemble.
fastForestfastForest Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle de forêt rapide avec rxEnsemble.Creates a list containing the function name and arguments to train a Fast Forest model with rxEnsemble.
fastLinearfastLinear Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle linéaire rapide avec rxEnsemble.Creates a list containing the function name and arguments to train a Fast Linear model with rxEnsemble.
logisticRegressionlogisticRegression Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle de régression logistique avec rxEnsemble.Creates a list containing the function name and arguments to train a Logistic Regression model with rxEnsemble.
oneClassSvmoneClassSvm Crée une liste contenant le nom et les arguments de la fonction pour effectuer l’apprentissage d’un modèle OneClassSvm avec rxEnsemble.Creates a list containing the function name and arguments to train a OneClassSvm model with rxEnsemble.

7-Fonctions de mise en réseau neuronal7-Neural networking functions

Nom de la fonctionFunction name DescriptionDescription
optimizeroptimizer Spécifie des algorithmes d’optimisation pour l’algorithme de Machine Learning rxNeuralNet.Specifies optimization algorithms for the rxNeuralNet machine learning algorithm.

8-Fonctions d’état de package8-Package state functions

Nom de la fonctionFunction name DescriptionDescription
rxHashEnvrxHashEnv Objet d’environnement utilisé pour stocker l’état de l’ensemble du package.An environment object used to store package-wide state.

Utiliser MicrosoftMLHow to use MicrosoftML

Les fonctions de MicrosoftML peuvent être appelées dans du code R encapsulé dans des procédures stockées.Functions in MicrosoftML are callable in R code encapsulated in stored procedures. La plupart des développeurs créent des solutions MicrosoftML localement, puis migrent le code R terminé vers les procédures stockées en guise d’exercice de déploiement.Most developers build MicrosoftML solutions locally, and then migrate finished R code to stored procedures as a deployment exercise.

Le package MicrosoftML pour R est installé « prêt à l’emploi » dans SQL Server 2017.The MicrosoftML package for R is installed "out-of-the-box" in SQL Server 2017. Il est également compatible avec SQL Server 2016 si vous mettez à niveau les composants R pour l’instance : Upgrade an instance of SQL Server using binding (Mettre à niveau une instance de SQL Server à l’aide de la liaison)It is also available for use with SQL Server 2016 if you upgrade the R components for the instance: Upgrade an instance of SQL Server using binding

Le package n’est pas chargé par défaut.The package is not loaded by default. Dans un premier temps, chargez le package MicrosoftML, puis chargez RevoScaleR si vous devez utiliser des contextes de calcul distants ou des objets de source de données ou de connectivité associés.As a first step, load the MicrosoftML package, and then load RevoScaleR if you need to use remote compute contexts or related connectivity or data source objects. Ensuite, référencez les fonctions individuelles dont vous avez besoin.Then, reference the individual functions you need.

library(microsoftml);
library(RevoScaleR);
logisticRegression(args);

Voir aussiSee also