microsoftml (Python-Paket in SQL Server Machine Learning Services)

Gilt für: SQL Server 2017 (14.x) und höher

microsoftml ist ein Python-Paket von Microsoft, das leistungsstarke Machine-Learning-Algorithmen bereitstellt. Sie enthält Funktionen für Training, Transformationen, Bewertung, Text- und Bildanalyse sowie Featureextraktion zum Ableiten von Werten aus vorhandenen Daten. Das Paket ist in Machine Learning Services in SQL Server enthalten und unterstützt Hochleistung für Big Data. Dafür wird Verarbeitung mit mehreren Kernen und schnelles Datenstreaming verwendet.

Paketdetails Informationen
Aktuelle Version: 9.4
Basiert auf: Anaconda 4.2-Distribution von Python 3.7.1
Paketverteilung: SQL Server Machine Learning Services, Version 2017 oder 2019.

Verwenden von microsoftml

Das Modul microsoftml wird als Teil von SQL Server Machine Learning Services installiert, wenn Sie Python Ihrer Installation hinzufügen. Sie erhalten die vollständige Sammlung proprietärer Pakete sowie eine Python-Distribution mit ihren Modulen und Interpretern. Sie können eine beliebige Python-IDE verwenden, um ein Python-Skript zu schreiben, das Funktionen in microsoftml aufruft. Das Skript muss jedoch auf einem Computer mit SQL Server Machine Learning Services mit Python ausgeführt werden.

microsoftml und revoscalepy sind eng miteinander verbunden. In microsoftsoftml verwendete Datenquellen sind als revoscalepy-Objekte definiert. Computekontextbegrenzungen in revoscalepy werden von microsoftml übernommen. Die gesamte Funktionalität für lokale Vorgänge ist zwar verfügbar, aber der Wechsel zu einem Remotecomputekontext erfordert RxSpark oder RxInSQLServer.

Versionen und Plattformen

Das Modul microsoftml ist nur verfügbar, wenn Sie eines der folgenden Microsoft-Produkte bzw. einen der folgenden Downloads installieren:

Hinweis

Vollständige Produktversionen sind in SQL Server 2017 nur unter Windows verfügbar. In SQL Server 2019 wird microsoftml sowohl unter Windows als auch unter Linux unterstützt.

Paketabhängigkeiten

Die Algorithmen folgender Elemente hängen in microsoftml von revoscalepy ab:

  • Datenquellenobjekte: Die von microsoftml-Funktionen genutzten Daten werden mithilfe von revoscalepy-Funktionen erstellt.
  • Remotecomputing (Verschieben der Funktionsausführung in eine SQL Server-Remoteinstanz): Das revoscalepy-Paket bietet Funktionen zum Erstellen und Aktivieren eines Remotecomputekontexts für SQL Server.

In den meisten Fällen werden die Pakete bei der Verwendung von microsoftml zusammen geladen.

Funktionen nach Kategorie

In diesem Abschnitt werden die Funktionen nach Kategorien aufgelistet, damit Sie einen Überblick über die Verwendung der einzelnen Funktionen erhalten. Im Inhaltsverzeichnis können Sie in alphabetischer Reihenfolge nach den Funktionen suchen.

1: Trainingsfunktionen

Funktion BESCHREIBUNG
microsoftml.rx_ensemble Trainiert ein Modellensemble
microsoftml.rx_fast_forest Zufällige Gesamtstruktur
microsoftml.rx_fast_linear Lineares Modell mit doppeltem stochastischen Koordinatenanstieg
microsoftml.rx_fast_trees Verstärkte Entscheidungsbäume
microsoftml.rx_logistic_regression Logistische Regression
microsoftml.rx_neural_network Neuronales Netzwerk
microsoftml.rx_oneclass_svm Erkennt Anomalien

2: Transformationsfunktionen

Behandeln von kategorischen Variablen

Funktion BESCHREIBUNG
microsoftml.categorical Konvertiert Textspalten in Kategorien
microsoftml.categorical_hash Erstellt einen Hash für eine Textspalte und konvertiert diese in Kategorien

Schemabearbeitung

Funktion BESCHREIBUNG
microsoftml.concat Verkettet mehrere Spalten zu einem einzelnen Vektor
microsoftml.drop_columns Löscht Spalten aus einem Dataset
microsoftml.select_columns Behält Spalten eines Datasets bei

Variablenauswahl

Funktion BESCHREIBUNG
microsoftml.count_select Wählt Funktionen basierend auf Anzahlen aus
microsoftml.mutualinformation_select Wählt Funktionen auf der Grundlage von gegenseitigen Informationen aus

Textanalyse

Funktion BESCHREIBUNG
microsoftml.featurize_text Konvertiert Textspalten in numerische Funktionen
microsoftml.get_sentiment Stimmungsanalyse

Bildanalyse

Funktion BESCHREIBUNG
microsoftml.load_image Lädt ein Bild
microsoftml.resize_image Ändert die Größe eines Bilds
microsoftml.extract_pixels Extrahiert Pixel aus einem Bild
microsoftml.featurize_image Konvertiert ein Bild in Features

Featurefunktionen

Funktion BESCHREIBUNG
microsoftml.rx_featurize Datentransformation für Datenquellen

Bewertungsfunktionen

Funktion BESCHREIBUNG
microsoftml.rx_predict Nimmt Bewertungen unter Verwendung eines Microsoft Machine Learning-Modells vor

Vorgehensweise beim Abrufen von microsoftml

Funktionen in microsoftml können in Python-Code aufgerufen werden, der in gespeicherten Prozeduren gekapselt ist. Die meisten Entwickler erstellen microsoftml-Lösungen lokal, und migrieren den fertigen Python-Code anschließend als Bereitstellungsübung in gespeicherte Prozeduren.

Das microsoftml-Paket für Python ist standardmäßig installiert, im Gegensatz zu revoscalepy wird es jedoch nicht standardmäßig geladen, wenn Sie eine Python-Sitzung mit den mit SQL Server installierten Python-Dateien starten.

Importieren Sie zunächst das microsoftml-Paket, und importieren Sie anschließend revoscalepy, wenn Sie Remotecomputekontexte oder zugehörige Verbindungs- oder Datenquellenobjekte verwenden müssen. Verweisen Sie dann auf die einzelnen Funktionen, die Sie benötigen.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Weitere Informationen