microsoftml (pacchetto Python in Machine Learning Services per SQL Server)

Si applica a: SQL Server 2017 (14.x) e versioni successive

microsoftml è un pacchetto Python di Microsoft che fornisce algoritmi di Machine Learning con prestazioni elevate. Include funzioni per il training e le trasformazioni, l'assegnazione dei punteggi, l'analisi di testo e immagini e l'estrazione di caratteristiche per la derivazione di valori da dati esistenti. Il pacchetto è incluso in Machine Learning Services per SQL Server e offre prestazioni elevate per i Big Data, con l'elaborazione multicore e un flusso dei dati rapido.

Dettagli del pacchetto Informazioni
Versione corrente: 9.4
Basato su: Distribuzione Anaconda 4.2 di Python 3.7.1
Distribuzione pacchetto: SQL Server Machine Learning Services versione 2017 o 2019.

Come usare microsoftml

Il modulo microsoftml viene installato come parte di SQL Server Machine Learning Services quando si aggiunge Python all'installazione. Si ottiene la raccolta completa di pacchetti proprietari e una distribuzione Python con i relativi moduli e interpreti. È possibile usare qualsiasi IDE Python per scrivere funzioni di chiamata di script Python in microsoftml, ma lo script deve essere eseguito in un computer con SQL Server Machine Learning Services con Python.

Microsoftml e revoscalepy sono strettamente collegati. Le origini dati usate in microsoftml sono definite come oggetti revoscalepy. Le limitazioni del contesto di calcolo in revoscalepy vengono trasferite a microsoftml. In particolare, tutte le funzionalità sono disponibili per le operazioni locali, ma per passare a un contesto di calcolo remoto è necessario RxSpark o RxInSQLServer.

Versioni e piattaforme

Il modulo microsoftml è disponibile solo quando si installa uno dei prodotti o download Microsoft seguenti:

Nota

Le versioni complete del prodotto sono solo per Windows in SQL Server 2017. Sia Windows che Linux sono supportati per microsoftml in SQL Server 2019.

Dipendenze dei pacchetti

Gli algoritmi in microsoftml dipendono da revoscalepy per:

  • Oggetti di origine dati: i dati utilizzati dalle funzioni di microsoftml vengono creati usando le funzioni di revoscalepy.
  • Remote computing (spostamento dell'esecuzione di funzioni in un'istanza remota di SQL Server): il pacchetto revoscalepy fornisce funzioni per la creazione e l'attivazione di un contesto di calcolo remoto per SQL Server.

Nella maggior parte dei casi, i pacchetti vengono caricati insieme ogni volta che si usa microsoftml.

Funzioni per categoria

Questa sezione elenca le funzioni per categoria per offrire un'idea di come vengono usate. È anche possibile usare il sommario per trovare le funzioni in ordine alfabetico.

1 - Funzioni di training

Funzione Descrizione
microsoftml.rx_ensemble Esegue il training di un insieme di modelli.
microsoftml.rx_fast_forest Foresta casuale.
microsoftml.rx_fast_linear Modello lineare con crescita a doppia coordinata stocastica.
microsoftml.rx_fast_trees Alberi con boosting.
microsoftml.rx_logistic_regression Regressione logistica.
microsoftml.rx_neural_network Rete neurale.
microsoftml.rx_oneclass_svm Rilevamento di anomalie.

2 - Funzioni di trasformazione

Gestione delle variabili di categoria

Funzione Descrizione
microsoftml.categorical Converte una colonna di testo in categorie.
microsoftml.categorical_hash Esegue l'hashing e converte una colonna di testo in categorie.

Manipolazione dello schema

Funzione Descrizione
microsoftml.concat Concatena più colonne in un singolo vettore.
microsoftml.drop_columns Elimina le colonne da un set di dati.
microsoftml.select_columns Mantiene le colonne di un set di dati.

selezione di variabili

Funzione Descrizione
microsoftml.count_select Seleziona le caratteristiche in base a conteggi.
microsoftml.mutualinformation_select Seleziona le caratteristiche in base a informazioni reciproche.

Analisi del testo

Funzione Descrizione
microsoftml.featurize_text Converte le colonne di testo in caratteristiche numeriche.
microsoftml.get_sentiment Analisi di valutazione.

Analisi delle immagini

Funzione Descrizione
microsoftml.load_image Carica un'immagine.
microsoftml.resize_image Ridimensiona un'immagine.
microsoftml.extract_pixels Estrae i pixel da un'immagine.
microsoftml.featurize_image Converte un'immagine in caratteristiche.

Funzioni di definizione delle caratteristiche

Funzione Descrizione
microsoftml.rx_featurize Trasformazione dei dati per le origini dati

Funzioni di assegnazione dei punteggi

Funzione Descrizione
microsoftml.rx_predict Assegna punteggi usando un modello di Machine Learning Microsoft

Come chiamare microsoftml

Le funzioni in microsoftml possono essere chiamate nel codice Python incapsulato nelle stored procedure. La maggior parte degli sviluppatori compila in locale le soluzioni microsoftml e quindi esegue la migrazione del codice Python completato alle stored procedure, come esercizio di distribuzione.

Il pacchetto microsoftml per Python viene installato per impostazione predefinita, ma a differenza di revoscalepy, non viene caricato per impostazione predefinita quando si avvia una sessione Python usando i file eseguibili di Python installati con SQL Server.

Per prima cosa, importare il pacchetto microsoftml e quindi importare revoscalepy se è necessario usare contesti di calcolo remoti oppure oggetti di origine dati o connettività correlati. Fare quindi riferimento alle singole funzioni necessarie.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Vedi anche