microsoftml (package Python de SQL Server Machine Learning Services)

S’applique à : SQL Server 2017 (14.x) et versions plus récentes

microsoftml est un package Python de Microsoft qui fournit des algorithmes de Machine Learning hautes performances. Il comprend des fonctions d’apprentissage et de transformation, de scoring, d’analyse de texte et d’image, ainsi que d’extraction de caractéristiques pour dériver des valeurs à partir de données existantes. Le package, inclus dans SQL Server Machine Learning Services, prend en charge les opérations hautes performances sur le Big Data, l’utilisation du traitement multicœur et le streaming de données rapide.

Détails du package Information
Version actuelle : 9,4
Créé sur : distribution Anaconda 4.2 de Python 3.7.1
Distribution du package : SQL Server Machine Learning Services version 2017 ou 2019.

Utiliser microsoftml

Le module microsoftml est installé en même temps que SQL Server Services Machine Learning lorsque vous ajoutez Python à votre installation. Vous bénéficiez de l'intégralité des packages propriétaires ainsi que d'une distribution Python, avec ses modules et interpréteurs. Vous pouvez utiliser n'importe quel environnement IDE Python pour écrire un script Python appelant des fonctions dans microsoftml, mais le script doit être exécuté sur un ordinateur doté de SQL Server Machine Learning Services avec Python.

Les modules microsoftml et revoscalepy sont étroitement couplés ; les sources de données utilisées dans microsoftml sont définies en tant qu'objets revoscalepy. Les limitations du contexte de calcul dans revoscalepy sont transmises à microsoftml. En d'autres termes, toutes les fonctionnalités sont disponibles pour les opérations locales, mais le passage à un contexte de calcul distant requiert RxSpark ou RxInSQLServer.

Versions et plateformes

Le module microsoftml n'est disponible que lorsque vous installez l'un des produits ou téléchargements Microsoft suivants :

Notes

Les versions complètes du produit sont uniquement disponibles sous Windows dans SQL Server 2017. Windows et Linux sont pris en charge pour microsoftml dans SQL Server 2019.

Dépendances de package

Les algorithmes dans microsoftml dépendent de revoscalepy pour :

  • Objets source de données : les données consommées par les fonctions microsoftml sont créées à l'aide des fonctions revoscalepy.
  • Informatique à distance (déplacement de l'exécution de la fonction vers une instance distante de SQL Server) : le package revoscalepy fournit des fonctions permettant de créer et d'activer un contexte de calcul distant pour SQL Server.

Dans la plupart des cas, vous devez charger les packages ensemble chaque fois que vous utilisez microsoftml.

Fonctions par catégorie

Cette section répertorie les fonctions par catégorie pour vous donner une idée de la façon dont chacune d’elles est utilisée. Vous pouvez également utiliser la table des matières pour rechercher des fonctions dans l’ordre alphabétique.

1 - Fonctions d’entraînement

Fonction Description
microsoftml.rx_ensemble Effectuer l’apprentissage d’un ensemble de modèles.
microsoftml.rx_fast_forest Forêt aléatoire.
microsoftml.rx_fast_linear Modèle linéaire. avec élévation stochastique à double coordonnée.
microsoftml.rx_fast_trees Arbres augmentés.
microsoftml.rx_logistic_regression Régression logistique.
microsoftml.rx_neural_network Réseau neuronal.
microsoftml.rx_oneclass_svm Détection d’anomalie.

2 - Fonctions de transformation

Gestion des variables de catégorie

Fonction Description
microsoftml.categorical Convertit une colonne de texte en catégories.
microsoftml.categorical_hash Hache et convertit une colonne de texte en catégories.

Manipulation de schéma

Fonction Description
microsoftml.concat Concatène plusieurs colonnes en un seul vecteur.
microsoftml.drop_columns Supprime des colonnes d’un jeu de données.
microsoftml.select_columns Conserve les colonnes d’un jeu de données.

sélection des variables

Fonction Description
microsoftml.count_select Sélection des caractéristiques en fonction du nombre.
microsoftml.mutualinformation_select Sélection des caractéristiques en fonction des informations mutuelles.

Analytique de texte

Fonction Description
microsoftml.featurize_text Convertit les colonnes de texte en caractéristiques numériques.
microsoftml.get_sentiment Analyse des sentiments.

Analyse d’image

Fonction Description
microsoftml.load_image Charge une image.
microsoftml.resize_image Redimensionne une image.
microsoftml.extract_pixels Extrait les pixels d’une image.
microsoftml.featurize_image Convertit une image en caractéristiques.

Fonctions de caractérisation

Fonction Description
microsoftml.rx_featurize Transformation de données pour les sources de données

Fonctions de scoring

Fonction Description
microsoftml.rx_predict Scores à l’aide d’un modèle Machine Learning Microsoft

Comment appeler microsoftml

Les fonctions de microsoftml peuvent être appelées dans du code Python encapsulé dans des procédures stockées. La plupart des développeurs créent des solutions microsoftml localement, puis migrent le code Python terminé vers les procédures stockées en guise d’exercice de déploiement.

Le package microsoftml pour Python est installé par défaut, mais contrairement à revoscalepy, il n’est pas chargé par défaut quand vous démarrez une session Python à l’aide des exécutables Python installés avec SQL Server.

Dans un premier temps, importez le package microsoftml et importez revoscalepy si vous devez utiliser des contextes de calcul distants ou des objets de source de données ou de connectivité associés. Ensuite, référencez les fonctions individuelles dont vous avez besoin.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Voir aussi