Lernprogramm: R-Datenanalysen für SQL-EntwicklerTutorial: R data analytics for SQL developers

Gilt für: JaSQL Server NeinAzure SQL-Datenbank NeinAzure Synapse Analytics (SQL DW) NeinParallel Data Warehouse APPLIES TO: yesSQL Server noAzure SQL Database noAzure Synapse Analytics (SQL DW) noParallel Data Warehouse

In diesem Tutorial für SQL-Programmierer erfahren Sie, wie Sie R durch Erstellen und Bereitstellen einer R-basierten Machine Learning-Lösung mithilfe der Datenbank NYCTaxi_sample in SQL Server integrieren.In this tutorial for SQL programmers, learn about R integration by building and deploying an R-based machine learning solution using a NYCTaxi_sample database on SQL Server. Sie verwenden T-SQL, SQL Server Management Studio und eine Datenbank-Engine-Instanz mit Machine Learning Services und der Unterstützung der R-Programmiersprache.You'll use T-SQL, SQL Server Management Studio, and a database engine instance with [Machine Learning Services](Machine Learning Services and the R language support

Dieses Tutorial bietet eine Einführung in R-Funktionen, die in einem Workflow für Datenmodellierung verwendet werden.This tutorial introduces you to R functions used in a data modeling workflow. Dies beinhaltet das Durchsuchen von Daten, das Entwickeln und Trainieren eines binären Klassifizierungsmodells sowie die Modellbereitstellung.Steps include data exploration, building and training a binary classification model, and model deployment. Mit dem Modell, das Sie erstellen, soll vorhergesagt werden, ob eine Fahrt (basierend auf der Tageszeit, der zurückgelegten Strecke und der Abholadresse) zur Gabe von Trinkgeld führt.The model you will build predicts whether a trip is likely to result in a tip based on the time of day, distance traveled, and pick-up location.

Der gesamte in diesem Tutorial verwendete R-Code wird in gespeicherte Prozeduren eingebunden, die Sie in Management Studio erstellen und ausführen.All of the R code used in this tutorial is wrapped in stored procedures that you create and run in Management Studio.

Hintergrund für SQL-EntwicklerBackground for SQL developers

Der Erstellungsprozess einer Machine Learning-Lösung ist komplex und kann den Einsatz mehrerer Tools sowie die phasenübergreifende Koordinierung von Experten bei folgenden Schritten erfordern:The process of building a machine learning solution is a complex one that can involve multiple tools, and the coordination of subject matter experts across several phases:

  • beim Abrufen und Bereinigen von Datenobtaining and cleaning data
  • beim Untersuchen der Daten und Entwickeln von Modellierungsfunktionenexploring the data and building features useful for modeling
  • beim Trainieren und Optimieren des Modellstraining and tuning the model
  • beim Bereitstellen in der Produktiondeployment to production

Die Entwicklung und das Testen des eigentlichen Codes werden am besten in einer dedizierten R-Entwicklungsumgebung durchgeführt.Development and testing of the actual code is best performed using a dedicated R development environment. Nachdem das Skript vollständig getestet wurde, können Sie es jedoch problemlos in SQL ServerSQL Server mithilfe von gespeicherten Transact-SQLTransact-SQL-Prozeduren in der vertrauten Umgebung von Management StudioManagement Studio bereitstellen.However, after the script is fully tested, you can easily deploy it to SQL ServerSQL Server using Transact-SQLTransact-SQL stored procedures in the familiar environment of Management StudioManagement Studio.

Dieses mehrteilige Tutorial stellt eine Einführung in einen typischen Workflow für die Migration von „fertiggestelltem R-Code“ zu SQL Server dar.The purpose of this multi-part tutorial is an introduction to a typical workflow for migrating "finished R code" to SQL Server.

Rufen Sie das Modell nach dem Speichern in der Datenbank für Vorhersagen aus Transact-SQLTransact-SQL mithilfe von gespeicherten Prozeduren auf.After the model has been saved to the database, call the model for predictions from Transact-SQLTransact-SQL by using stored procedures.

VoraussetzungenPrerequisites

Alle Aufgaben können mithilfe von gespeicherten Transact-SQLTransact-SQL-Prozeduren in Management StudioManagement Studio ausgeführt werden.All tasks can be done using Transact-SQLTransact-SQL stored procedures in Management StudioManagement Studio.

Für dieses Tutorial sollten Sie sich mit grundlegenden Datenbankvorgängen auskennen, wie z. B. dem Erstellen von Datenbanken und Tabellen, dem Importieren von Daten und dem Schreiben von SQL-Abfragen.This tutorial assumes familiarity with basic database operations such as creating databases and tables, importing data, and writing SQL queries. Kenntnisse im Umgang mit R sind nicht erforderlich. Daher wird der gesamte R-Code bereitgestellt.It does not assume you know R. As such, all R code is provided.

Nächste SchritteNext steps