microsoftml (Python-Paket in SQL Server Machine Learning Services)

Anwendungsbereich: JaSQL Server 2017 (14.x) und höher

microsoftml ist ein Python-Paket von Microsoft, das leistungsstarke Machine-Learning-Algorithmen bereitstellt. Sie enthält Funktionen für Training, Transformationen, Bewertung, Text- und Bildanalyse sowie Featureextraktion zum Ableiten von Werten aus vorhandenen Daten. Das Paket ist in Machine Learning Services in SQL Server enthalten und unterstützt Hochleistung für Big Data. Dafür wird Verarbeitung mit mehreren Kernen und schnelles Datenstreaming verwendet.

Vollständige Referenzdokumentation

Das microsoftml-Paket wird in mehreren Microsoft-Produkten bereitgestellt. Die Verwendung ist jedoch immer identisch, unabhängig davon, ob Sie das Paket in SQL Server oder einem anderen Produkt abrufen. Da die Funktionen identisch sind, wird die Dokumentation für einzelne microsoftml-Funktionen nur an einer Stelle in der Python-Referenz veröffentlicht. Abweichungen durch produktspezifisches Verhalten finden Sie ggf. auf der Hilfeseite der Funktion.

Versionen und Plattformen

Das microsoftml-Modul basiert auf Python 3.5 und ist nur verfügbar, wenn Sie eines der folgenden Microsoft-Produkte oder Downloads installieren:

Hinweis

Vollständige Produktversionen sind in SQL Server 2017 nur unter Windows verfügbar. In SQL Server 2019 wird microsoftml sowohl unter Windows als auch unter Linux unterstützt.

Paketabhängigkeiten

Die Algorithmen folgender Elemente hängen in microsoftml von revoscalepy ab:

  • Datenquellenobjekte: Die von microsoftml-Funktionen genutzten Daten werden mithilfe von revoscalepy-Funktionen erstellt.
  • Remotecomputing (das Verschieben der Funktionsausführung in eine SQL Server-Remoteinstanz): Das revoscalepy-Paket stellt Funktionen zum Erstellen und Aktivieren eines Remotecomputekontexts für SQL Server bereit.

In den meisten Fällen werden die Pakete bei der Verwendung von microsoftml zusammen geladen.

Funktionen nach Kategorie

In diesem Abschnitt werden die Funktionen nach Kategorien aufgelistet, damit Sie einen Überblick über die Verwendung der einzelnen Funktionen erhalten. Im Inhaltsverzeichnis können Sie in alphabetischer Reihenfolge nach den Funktionen suchen.

1: Trainingsfunktionen

Funktion BESCHREIBUNG
microsoftml.rx_ensemble Trainiert ein Modellensemble
microsoftml.rx_fast_forest Zufällige Gesamtstruktur
microsoftml.rx_fast_linear Lineares Modell mit doppeltem stochastischen Koordinatenanstieg
microsoftml.rx_fast_trees Verstärkte Entscheidungsbäume
microsoftml.rx_logistic_regression Logistische Regression
microsoftml.rx_neural_network Neuronales Netzwerk
microsoftml.rx_oneclass_svm Erkennt Anomalien

2: Transformationsfunktionen

Behandeln von kategorischen Variablen

Funktion BESCHREIBUNG
microsoftml.categorical Konvertiert Textspalten in Kategorien
microsoftml.categorical_hash Erstellt einen Hash für eine Textspalte und konvertiert diese in Kategorien

Schemabearbeitung

Funktion BESCHREIBUNG
microsoftml.concat Verkettet mehrere Spalten zu einem einzelnen Vektor
microsoftml.drop_columns Löscht Spalten aus einem Dataset
microsoftml.select_columns Behält Spalten eines Datasets bei

Variablenauswahl

Funktion BESCHREIBUNG
microsoftml.count_select Wählt Funktionen basierend auf Anzahlen aus
microsoftml.mutualinformation_select Wählt Funktionen auf der Grundlage von gegenseitigen Informationen aus

Textanalyse

Funktion BESCHREIBUNG
microsoftml.featurize_text Konvertiert Textspalten in numerische Funktionen
microsoftml.get_sentiment Stimmungsanalyse

Bildanalyse

Funktion BESCHREIBUNG
microsoftml.load_image Lädt ein Bild
microsoftml.resize_image Ändert die Größe eines Bilds
microsoftml.extract_pixels Extrahiert Pixel aus einem Bild
microsoftml.featurize_image Konvertiert ein Bild in Features

Featurefunktionen

Funktion BESCHREIBUNG
microsoftml.rx_featurize Datentransformation für Datenquellen

3: Bewertungsfunktionen

Funktion BESCHREIBUNG
microsoftml.rx_predict Nimmt Bewertungen unter Verwendung eines Microsoft Machine Learning-Modells vor

Vorgehensweise beim Abrufen von microsoftml

Funktionen in microsoftml können in Python-Code aufgerufen werden, der in gespeicherten Prozeduren gekapselt ist. Die meisten Entwickler erstellen microsoftml-Lösungen lokal, und migrieren den fertigen Python-Code anschließend als Bereitstellungsübung in gespeicherte Prozeduren.

Das microsoftml-Paket für Python ist standardmäßig installiert, im Gegensatz zu revoscalepy wird es jedoch nicht standardmäßig geladen, wenn Sie eine Python-Sitzung mit den mit SQL Server installierten Python-Dateien starten.

Importieren Sie zunächst das microsoftml-Paket, und importieren Sie anschließend revoscalepy, wenn Sie Remotecomputekontexte oder zugehörige Verbindungs- oder Datenquellenobjekte verwenden müssen. Verweisen Sie dann auf die einzelnen Funktionen, die Sie benötigen.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Weitere Informationen