Python-Tutorial: Vorhersagen, wie viele Ski verliehen werden, mithilfe linearer Regression mit SQL Machine LearningPython tutorial: Predict ski rental with linear regression with SQL machine learning

Anwendungsbereich:Applies to: JaSQL Server 2017 (14.x)SQL Server 2017 (14.x)yesSQL Server 2017 (14.x)SQL Server 2017 (14.x) und höher JaVerwaltete Azure SQL-InstanzAzure SQL Managed InstanceYesVerwaltete Azure SQL-InstanzAzure SQL Managed InstanceAnwendungsbereich:Applies to: JaSQL Server 2017 (14.x)SQL Server 2017 (14.x)yesSQL Server 2017 (14.x)SQL Server 2017 (14.x) and later JaVerwaltete Azure SQL-InstanzAzure SQL Managed InstanceYesVerwaltete Azure SQL-InstanzAzure SQL Managed Instance

In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services oder in Big Data-Clustern zur Vorhersage der Verleihzahlen für einen Skiverleih.In this four-part tutorial series, you will use Python and linear regression in SQL Server Machine Learning Services or on Big Data Clusters to predict the number of ski rentals. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.The tutorial use a Python notebook in Azure Data Studio.

In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services zur Vorhersage von Verleihzahlen für einen Skiverleih.In this four-part tutorial series, you will use Python and linear regression in SQL Server Machine Learning Services to predict the number of ski rentals. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.The tutorial use a Python notebook in Azure Data Studio.

In dieser vierteiligen Tutorialreihe verwenden Sie Python und lineare Regression in Machine Learning Services in Azure SQL Managed Instance zur Vorhersage von Verleihzahlen für einen Skiverleih.In this four-part tutorial series, you will use Python and linear regression in Azure SQL Managed Instance Machine Learning Services to predict the number of ski rentals. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.The tutorial use a Python notebook in Azure Data Studio.

Angenommen, Sie möchten für Ihren eigenen Skiverleih die Verleihzahlen für einen bestimmten Zeitpunkt in der Zukunft vorhersagen.Imagine you own a ski rental business and you want to predict the number of rentals that you'll have on a future date. Mit dieser Information können Sie den Bestand, die Mitarbeiter und die Räumlichkeiten besser vorausplanen.This information will help you get your stock, staff, and facilities ready.

Im ersten Teil der Reihe bereiten Sie die Voraussetzungen vor.In the first part of this series, you'll get set up with the prerequisites. Im zweiten und dritten Teil entwickeln Sie Python-Skripts in einem Notebook zur Vorbereitung Ihrer Daten und zum Trainieren eines Machine Learning-Modells.In parts two and three, you'll develop some Python scripts in a notebook to prepare your data and train a machine learning model. In Teil 3 führen Sie diese Python-Skripts dann in der Datenbank mithilfe von gespeicherten T-SQL-Prozeduren aus.Then, in part three, you'll run those Python scripts inside the database using T-SQL stored procedures.

In diesem Artikel lernen Sie Folgendes:In this article, you'll learn how to:

  • Importieren einer BeispieldatenbankImport a sample database

In Teil 2 lernen Sie, wie Sie die Daten aus einer Datenbank in einen Python-Datenrahmen laden und in Python vorbereiten.In part two, you'll learn how to load the data from a database into a Python data frame, and prepare the data in Python.

In Teil 3 trainieren Sie ein lineares Regressionsmodell in Python.In part three, you'll learn how to train a linear regression model in Python.

In Teil 4 haben Sie gelernt, wie Sie das Modell in einer Datenbank speichern und gespeicherte Prozeduren aus den Python-Skripts erstellen, die Sie in Teil 2 und 3 entwickelt haben.In part four, you'll learn how to store the model in a database, and then create stored procedures from the Python scripts you developed in parts two and three. Die gespeicherten Prozeduren werden auf dem Server ausgeführt, um Vorhersagen basierend auf neuen Daten treffen zu können.The stored procedures will run on the server to make predictions based on new data.

VoraussetzungenPrerequisites

  • Python-IDE: In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.Python IDE - This tutorial uses a Python notebook in Azure Data Studio. Weitere Informationen finden Sie unter Verwenden von Notebooks in Azure Data Studio.For more information, see How to use notebooks in Azure Data Studio.

  • SQL-Abfragetool: In diesem Tutorial wird davon ausgegangen, dass Sie Azure Data Studio verwenden.SQL query tool - This tutorial assumes you're using Azure Data Studio.

  • Weitere Python-Pakete: In den Beispielen in dieser Tutorialreihe werden die folgenden Python-Pakete verwendet, die möglicherweise nicht standardmäßig installiert sind:Additional Python packages - The examples in this tutorial series use the following Python packages that may not be installed by default:

    • pandaspandas
    • pyodbcpyodbc
    • sklearnsklearn

    Installieren Sie diese Pakete wie folgt:To install these packages:

    1. Klicken Sie in Ihrem Azure Data Studio-Notebook auf die Option Pakete verwalten.In your Azure Data Studio notebook, select Manage Packages.
    2. Klicken Sie dann im Bereich Manage Packages (Pakete verwalten) auf die Registerkarte Add new (Neue hinzufügen).In the Manage Packages pane, select the Add new tab.
    3. Geben Sie für jedes der folgenden Pakete den jeweiligen Paketnamen ein, klicken Sie auf Suchen und dann auf Installieren.For each of the following packages, enter the package name, click Search, then click Install.

    Alternativ können Sie eine Eingabeaufforderung öffnen, zum Installationspfad für die Python-Version wechseln, die Sie in Azure Data Studio verwenden, (z. B. cd %LocalAppData%\Programs\Python\Python37-32) und dann für jedes Paket pip install ausführen.As an alternative, you can open a Command Prompt, change to the installation path for the version of Python you use in Azure Data Studio (for example, cd %LocalAppData%\Programs\Python\Python37-32), then run pip install for each package.

Wiederherstellen der BeispieldatenbankRestore the sample database

Die in diesem Tutorial verwendete Beispieldatenbank wurde in einer BAK-Datenbanksicherungsdatei gespeichert, die Sie herunterladen und verwenden können.The sample database used in this tutorial has been saved to a .bak database backup file for you to download and use.

Hinweis

Wenn Sie Machine Learning Services in Big Data-Clustern verwenden, finden Sie Informationen zum Wiederherstellen unter Wiederherstellen einer Datenbank in der Masterinstanz eines Big Data-Clusters für SQL Server.If you are using Machine Learning Services on Big Data Clusters, see how to Restore a database into the SQL Server big data cluster master instance.

  1. Laden Sie die Datei TutorialDB.bak herunter.Download the file TutorialDB.bak.

  2. Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank aus einer Sicherungsdatei in Azure Data Studio, und verwenden Sie hierzu die folgenden Details:Follow the directions in Restore a database from a backup file in Azure Data Studio, using these details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.Import from the TutorialDB.bak file you downloaded
    • Geben Sie der Zieldatenbank den Namen „TutorialDB“.Name the target database "TutorialDB"
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank vorhanden ist, indem Sie die Tabelle dbo.rental_data abfragen:You can verify that the restored database exists by querying the dbo.rental_data table:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Laden Sie die Datei TutorialDB.bak herunter.Download the file TutorialDB.bak.

  2. Befolgen Sie die Anweisungen unter Schnellstart: Wiederherstellen einer Datenbank in Azure SQL Managed Instance mit SSMS im SQL Server Management Studio, und verwenden Sie hierzu die folgenden Details:Follow the directions in Restore a database to a Managed Instance in SQL Server Management Studio, using these details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.Import from the TutorialDB.bak file you downloaded
    • Geben Sie der Zieldatenbank den Namen „TutorialDB“.Name the target database "TutorialDB"
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank vorhanden ist, indem Sie die Tabelle dbo.rental_data abfragen:You can verify that the restored database exists by querying the dbo.rental_data table:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Bereinigen von RessourcenClean up resources

Wenn Sie nicht mit diesem Tutorial fortfahren möchten, löschen Sie die Datenbank „TutorialDB“.If you're not going to continue with this tutorial, delete the TutorialDB database.

Nächste SchritteNext steps

Im ersten Teil dieser Tutorialreihe haben Sie die folgenden Schritte ausgeführt:In part one of this tutorial series, you completed these steps:

  • Installieren der VoraussetzungenInstalled the prerequisites
  • Importieren einer BeispieldatenbankImport a sample database

Fahren Sie mit Teil 2 dieser Tutorialreihe fort, um die Daten aus der Datenbank „TutorialDB“ vorzubereiten:To prepare the data from the TutorialDB database, follow part two of this tutorial series: