Neuerungen in SQL Server-Machine Learning Services

Anwendungsbereich: JaSQL Server 2016 (13.x) und höher

In diesem Artikel wird beschrieben, welche neuen Funktionen und Features in den einzelnen Versionen von SQL Server Machine Learning Services enthalten sind. Funktionen für maschinelles Lernen werden SQL Server in jedem Release hinzugefügt, während wir die Integration zwischen der Datenplattform, erweiterten Analysen und Data Science weiter ausbauen, erweitern und vertiefen.

Neues in SQL Server 2019

Mit diesem Release wird SQL Server um die am häufigsten nachgefragten Funktionen für Vorgänge des maschinellen Lernens mit Python und R ergänzt. Weitere Informationen zu allen Features in diesem Release finden Sie unter Neuerungen in SQL Server 2019 und Versionshinweise für SQL Server 2019.

Hinweis

Die Dokumentation zu den Neuerungen für Java in SQL Server 2019 finden Sie unter Neuerungen in SQL Server-Spracherweiterungen.

Im Folgenden werden die neuen Features für SQL Server Machine Learning Services aufgeführt, die für Windows und Linux verfügbar sind:

Neuerungen in SQL Server 2017

Ab dieser Version werden Python-Unterstützung und branchenführende Algorithmen für maschinelles Lernen bereitgestellt. SQL Server 2017 wurde umbenannt, um den neuen Anwendungsbereich widerzuspiegeln. Gleichzeitig geht hiermit die Einführung von SQL Server Machine Learning Services (datenbankintern) einher, einschließlich der Sprachunterstützung für Python und R.

Ankündigungen sämtlicher neuer Funktionen finden Sie unter Neues in SQL Server 2017.

R-Erweiterungen

Bei der R-Komponente von SQL Server Machine Learning Services handelt es sich um die nächste Generation von SQL Server 2016 R Services, einschließlich aktualisierter Versionen von Basis-R, RevoScaler und anderen Paketen.

Zu den neuen Funktionen für R zählen die Paketverwaltung mit den folgenden Highlights:

R-Bibliotheken

Paket BESCHREIBUNG
MicrosoftML In diesem Release ist MicrosoftML in einer Standard-R-Installation integriert, wodurch der in den vorherigen SQL Server 2016 R Services erforderliche Upgradeschritt entfällt. MicrosoftML bietet modernste maschinelle Lernalgorithmen und Datentransformationen, die skaliert oder in Remotecomputekontexten ausgeführt werden können. Zu den Algorithmen gehören anpassbare Deep Neural Networks, Schnellentscheidungsstrukturen und -entscheidungswälder, lineare Regression und logistische Regression.

Python-Integration für datenbankinterne Analysen

Python ist eine Sprache, die eine große Flexibilität und Leistungsfähigkeit für eine Vielzahl von Aufgaben des maschinellen Lernens bietet. Open-Source-Bibliotheken für Python umfassen verschiedene Plattformen für anpassbare neuronale Netze sowie beliebte Bibliotheken für die Verarbeitung natürlicher Sprache.

Da Python in die Datenbank-Engine integriert ist, können Sie die Analysen datennah durchführen und die mit der Datenverschiebung verbundenen Kosten und Sicherheitsrisiken eliminieren. Sie können Lösungen des maschinellen Lernens auf Basis von Python mit Tools wie Visual Studio bereitstellen. Ihre Produktionsanwendungen können mit Hilfe von SQL Server-Datenzugriffsmethoden Vorhersagen, Modelle oder Visualisierungen aus der Python 3.5-Runtime abrufen.

Die T-SQL- und Python-Integration wird durch die gespeicherte Systemprozedur sp_execute_external_script unterstützt. Mit dieser gespeicherten Prozedur können Sie beliebigen Python-Code abrufen. Der Code wird in einer sicheren, dualen Architektur ausgeführt, die eine unternehmensweite Bereitstellung von Python-Modellen und -Skripts ermöglicht, welche über eine einfache gespeicherte Prozedur aus einer Anwendung aufgerufen werden können. Weitere Leistungssteigerungen werden durch das Streaming von Daten aus SQL an Python-Prozesse und durch die Parallelisierung von MPI-Ringen erzielt.

Sie können die T-SQL-Funktion PREDICT verwenden, um eine native Bewertung für ein vortrainiertes Modell vorzunehmen, das vorab im erforderlichen Binärformat gespeichert wurde.

Python-Bibliotheken

Paket BESCHREIBUNG
revoscalepy Dies ist die Python-Entsprechung zu RevoScaleR. Sie können Python-Modelle für lineare und logistische Regressionen, Entscheidungsstrukturen, verstärkte Strukturen und zufällige Gesamtstrukturen erstellen, die alle parallelisierbar sind und in Remotecomputekontexten ausgeführt werden können. Dieses Paket unterstützt die Verwendung mehrerer Datenquellen und Remotecomputekontexte. Der Datenanalyst oder -entwickler kann Python-Code auf einer SQL-Server-Remoteinstanz ausführen, um Daten zu untersuchen oder Modelle zu erstellen, ohne Daten zu verschieben.
microsoftml Dies ist die Python-Entsprechung zum MicrosoftML R-Paket.

Vortrainierte Modelle

Vortrainierte Modelle sind sowohl für Python als auch für R verfügbar. Verwenden Sie diese Modelle für die Bilderkennung und die Stimmungsanalyse (positiv/negativ), um Vorhersagen für Ihre eigenen Daten zu erstellen.

Eigenständiger Server als freigegebene Funktion im SQL Server-Setup

Mit diesem Release wird auch SQL Server Machine Learning Server (Standalone) eingeführt, ein vollständig unabhängiger Data Science-Server, der statistische Analysen und Vorhersageanalysen in R und Python unterstützt. Wie bei R Services handelt es sich bei diesem Server um die nächste Version von SQL Server 2016 R Server (Standalone). Mit dem eigenständigen Server können Sie R- oder Python-Lösungen ohne Abhängigkeiten auf SQL Server verteilen und skalieren.

Neues in SQL Server 2016

Mit diesem Release wurden Funktionen des maschinellen Lernens mithilfe von SQL Server 2016 R Services in SQL Server eingeführt. Bei diesen Services handelt es sich um eine datenbankinterne Analyse-Engine für die Verarbeitung von R-Skripts mit residenten Daten innerhalb einer Datenbank-Engine-Instanz.

Darüber hinaus wurde SQL Server 2016 R Server (Standalone) als Möglichkeit zum Installieren von R Server auf einem Windows-Server freigegeben. Anfangs stellte SQL Server-Setup die einzige Möglichkeit dar, R Server for Windows zu installieren. In späteren Versionen konnten Entwickler und Datenanalysten, die R Server unter Windows wünschten, ein anderes eigenständiges Installationsprogramm verwenden, um das gleiche Ziel zu erreichen. Der eigenständige Server in SQL Server ist funktional gleichwertig zum eigenständigen Serverprodukt Microsoft R Server for Windows.

Ankündigungen sämtlicher neuer Funktionen finden Sie unter Neues in SQL Server 2016.

Release Featureupdate
CU-Ergänzungen Die Echtzeitbewertung basiert auf nativen C++ Bibliotheken, um ein in einem optimierten Binärformat gespeichertes Modell zu lesen und dann Vorhersagen zu generieren, ohne die R-Runtime aufrufen zu müssen. Dadurch werden Bewertungsvorgänge erheblich beschleunigt. Mit der Echtzeitbewertung können Sie eine gespeicherte Prozedur ausführen oder die Echtzeitbewertung aus R-Code durchführen. Die Echtzeitbewertung ist auch für SQL Server 2016 verfügbar, wenn für die Instanz ein Upgrade auf die neueste Version von Microsoft R Server durchgeführt wurde.
Erste Veröffentlichung R-Integration für datenbankinterne Analysen.

R-Pakete zum Aufrufen von R-Funktionen in T-SQL und umgekehrt. RevoScaleR-Funktionen bieten skalierte R-Analysen, indem sie Daten in einzelne Komponenten zerlegen, die verteilte Verarbeitung koordinieren und verwalten und die Ergebnisse aggregieren. In SQL Server 2016 R Services (datenbankintern) ist die RevoScaleR-Engine in eine Instanz der Datenbank-Engine integriert, sodass Daten und Analysen in demselben Verarbeitungskontext zusammengefasst werden.

T-SQL- und R-Integration über sp_execute_external_script. Mit dieser gespeicherten Prozedur können Sie beliebigen R-Code abrufen. Diese sichere Infrastruktur erlaubt eine unternehmensweite Bereitstellung von Rn-Modellen und -Skripts, welche über eine einfache gespeicherte Prozedur aus einer Anwendung aufgerufen werden können. Weitere Leistungssteigerungen werden durch das Streaming von Daten aus SQL an R-Prozesse und durch die Parallelisierung von MPI-Ringen erzielt.

Sie können die T-SQL-Funktion PREDICT verwenden, um eine native Bewertung für ein vortrainiertes Modell vorzunehmen, das vorab im erforderlichen Binärformat gespeichert wurde.

Linux-Unterstützung

In SQL Server 2019 wird eine Linux-Unterstützung für R und Python bereitgestellt, wenn Sie die Pakete für das maschinelle Lernen mit einer Datenbank-Engine-Instanz installieren. Weitere Informationen finden Sie unter Installieren von SQL Server Machine Learning Services unter Linux.

Unter Linux verfügt SQL Server 2017 nicht über eine R- oder Python-Integration, Sie können jedoch die native Bewertung unter Linux verwenden, da diese Funktion über die T-SQL-Funktion PREDICT verfügbar ist, die unter Linux ausgeführt wird. Die native Bewertung ermöglicht eine leistungsstarke Bewertung aus einem vortrainierten Modell, ohne dass eine R-Runtime aufgerufen oder gar benötigt wird.

Nächste Schritte