Руководство по Разработка прогнозной модели в R с помощью машинного обучения SQL

Применимо к: SQL Server 2016 (13.x) и более поздних Управляемый экземпляр SQL Azure

В этом цикле учебников, состоящем из четырех частей, вы будете использовать R и модель машинного обучения в Службах машинного обучения SQL Server или Кластерах больших данных для прогнозирования количества прокатов лыж.

В этом цикле учебников, состоящем из четырех частей, вы будете использовать R и модель машинного обучения в Службах машинного обучения SQL Server для прогнозирования количества прокатов лыж.

В этом цикле учебников, состоящем из четырех частей, вы будете использовать R и модель машинного обучения в службах SQL Server R Services для прогнозирования количества прокатов лыж.

В этом цикле учебников, состоящем из четырех частей, вы будете использовать R и модель машинного обучения в Службах машинного обучения в управляемом экземпляре SQL Azure для прогнозирования количества прокатов лыж.

Представьте, что вы являетесь владельцем компании по прокату лыж и хотите спрогнозировать количество прокатов за некоторый будущий период. Эта информация поможет вам подготовить инвентарь, персонал и пункты проката.

В первой части учебника вы установите необходимые компоненты. Во второй и третьей частях вы создадите сценарии R в записной книжке для подготовки данных и обучения модели машинного обучения. Из третьей части вы узнаете, как выполнить эти скрипты на языке R в базе данных с помощью хранимых процедур T-SQL.

В этой статье вы узнаете, как выполнять следующие задачи.

  • Восстановление примера базы данных

Во второй части вы узнаете, как загрузить данные из базы данных в кадр данных Python, а также подготовить данные в R.

В третьей части вы узнаете, как обучить модель машинного обучения в R.

В четвертой части вы узнаете, как сохранить модель в базе данных, а затем создать хранимые процедуры на основе сценариев R, разработанных во второй и третьей частях. Хранимые процедуры будут запускаться на сервере, чтобы формировать прогнозы на основе новых данных.

Предварительные требования

  • IDE R. В этом учебнике используется RStudio Desktop.

  • RODBC — данный драйвер используется в сценариях R, разрабатываемых в рамках этого учебника. Установите его с помощью команды R install.packages("RODBC"), если этот драйвер еще не установлен. Дополнительные сведения о RODBC см. в разделе CRAN - Package RODBC (CRAN: пакет RODBC).

  • Инструмент SQL-запросов — в этом учебнике предполагается, что вы используете Azure Data Studio. Дополнительные сведения см. в статье Использование записных книжек в Azure Data Studio.

Восстановление примера базы данных

Пример базы данных, используемый в этом учебнике, сохранен в файл резервной копии базы данных BAK, чтобы его можно было скачать и использовать.

Примечание

Если вы используете Службы машинного обучения в Кластерах больших данных, ознакомьтесь со статьей Восстановление базы данных на главном экземпляре кластера больших данных SQL Server.

  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям из раздела Восстановление базы данных из файла резервной копии в Azure Data Studio, используя следующие сведения:

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Назовите целевую базу данных "TutorialDB".
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям в разделе Восстановление базы данных в Управляемый экземпляр в SQL Server Management Studio, используя следующие сведения.

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Назовите целевую базу данных "TutorialDB".
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Очистка ресурсов

Если вы не собираетесь продолжать работу с этим учебником, удалите базу данных TutorialDB.

Дальнейшие действия

В первой части этого учебника вы выполнили следующие действия:

  • Установка необходимых компонентов
  • Восстановленный пример базы данных

Чтобы подготовить данные из для модели машинного обучения, перейдите ко второй части этого учебника: