Tutoriel : analytique de données R pour les développeurs SQLTutorial: R data analytics for SQL developers

S’APPLIQUE À : ouiSQL Server nonAzure SQL Database nonAzure Synapse Analytics (SQL DW) nonParallel Data Warehouse APPLIES TO: yesSQL Server noAzure SQL Database noAzure Synapse Analytics (SQL DW) noParallel Data Warehouse

Dans ce didacticiel pour les programmeurs SQL, vous apprendrez à intégrer R en créant et en déployant une solution de Machine Learning basée sur R à l’aide d’une base de données NYCTaxi_sample sur SQL Server.In this tutorial for SQL programmers, learn about R integration by building and deploying an R-based machine learning solution using a NYCTaxi_sample database on SQL Server. Vous allez utiliser T-SQL, SQL Server Management Studio et une instance du moteur de base de données avec Machine Learning Services et la prise en charge du langage RYou'll use T-SQL, SQL Server Management Studio, and a database engine instance with Machine Learning Services and the R language support

Ce didacticiel vous présente les fonctions R utilisées dans un workflow de modélisation des données.This tutorial introduces you to R functions used in a data modeling workflow. Les étapes incluent l’exploration des données, la création et l’apprentissage d’un modèle de classification binaire et le déploiement d’un modèle.Steps include data exploration, building and training a binary classification model, and model deployment. Le modèle que vous allez créer prévoit si un trajet est susceptible de générer un pourboire en fonction de l’heure de la journée, de la distance parcourue et de l’emplacement de la prise en charge du passager.The model you will build predicts whether a trip is likely to result in a tip based on the time of day, distance traveled, and pick-up location.

Tous les codes R utilisés dans ce didacticiel sont encapsulés dans les procédures stockées que vous créez et exécutez dans Management Studio.All of the R code used in this tutorial is wrapped in stored procedures that you create and run in Management Studio.

Arrière-plan pour les développeurs SQLBackground for SQL developers

Le processus de création d’une solution de Machine Learning est complexe. Il peut impliquer plusieurs outils et la coordination de plusieurs experts durant les différentes phases :The process of building a machine learning solution is a complex one that can involve multiple tools, and the coordination of subject matter experts across several phases:

  • Extraction et nettoyage des donnéesobtaining and cleaning data
  • Exploration des données et création de caractéristiques utiles pour la modélisationexploring the data and building features useful for modeling
  • Apprentissage et optimisation du modèletraining and tuning the model
  • Déploiement en productiondeployment to production

Le développement et les tests du code réel fournissent de meilleurs résultats dans un environnement de développement dédié à R.Development and testing of the actual code is best performed using a dedicated R development environment. Toutefois, une fois que le script est entièrement testé, vous pouvez facilement le déployer sur SQL ServerSQL Server à l’aide de procédures stockées Transact-SQLTransact-SQL dans l’environnement familier de Management StudioManagement Studio.However, after the script is fully tested, you can easily deploy it to SQL ServerSQL Server using Transact-SQLTransact-SQL stored procedures in the familiar environment of Management StudioManagement Studio.

L’objectif de ce didacticiel en plusieurs parties est de vous présenter un workflow classique pour la migration de « code R terminé » vers SQL Server.The purpose of this multi-part tutorial is an introduction to a typical workflow for migrating "finished R code" to SQL Server.

Une fois que le modèle a été enregistré dans la base de données, appelez-le pour vos prédictions dans Transact-SQLTransact-SQL à l’aide de procédures stockées.After the model has been saved to the database, call the model for predictions from Transact-SQLTransact-SQL by using stored procedures.

Conditions préalables requisesPrerequisites

Toutes les tâches peuvent être effectuées à l’aide de procédures stockées Transact-SQLTransact-SQL dans Management StudioManagement Studio.All tasks can be done using Transact-SQLTransact-SQL stored procedures in Management StudioManagement Studio.

Vous devez être familiarisé avec les opérations de base de données, telles que la création de bases de données et de tables, l’importation de données et la rédaction de requêtes SQL.This tutorial assumes familiarity with basic database operations such as creating databases and tables, importing data, and writing SQL queries. Vous n’avez pas besoin de connaître R, car tout le code R est fourni.It does not assume you know R. As such, all R code is provided.

Étapes suivantesNext steps