Tutorial: Desenvolver um modelo preditivo no R com o machine learning do SQL

Aplica-se a: SQL Server 2016 (13.x) e versões posteriores Instância Gerenciada de SQL do Azure

Nesta séries de tutoriais de quatro partes, você usará R e um modelo de machine learning nos Serviços de Machine Learning do SQL Server ou nos Clusters de Big Data para prever o número de aluguéis de esqui.

Nesta séries de tutoriais de quatro partes, você usará o R e um modelo de machine learning nos Serviços de Machine Learning do SQL Server para prever o número de aluguéis de esqui.

Nesta séries de tutoriais de quatro partes, você usará o R e um modelo de machine learning no SQL Server R Services para prever o número de aluguéis de esqui.

Nesta série de tutoriais de quatro partes, você usará o R e um modelo de machine learning nos Serviços de Machine Learning da Instância Gerenciada de SQL do Azure para prever o número de aluguéis de esqui.

Imagine que você tenha um negócio de aluguel de esqui e queira prever o número de locações que você terá em uma data futura. Essas informações ajudarão você a preparar seu estoque, sua equipe e suas instalações.

Na primeira parte desta série, você se preparará com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts de R em um notebook para preparar seus dados e treinar um modelo de machine learning. Em seguida, na terceira parte, você executará esses scripts R em um banco de dados usando procedimentos armazenados T-SQL.

Neste artigo, você aprenderá a:

  • Restaurar um banco de dados de exemplo

Na parte dois, você aprenderá a carregar os dados de um banco de dados em uma estrutura do Python e a prepará-los no R.

Na parte três, você aprenderá a treinar um modelo de machine learning no R.

Na parte quatro, você aprenderá a armazenar o modelo em um banco de dados e, em seguida, criará procedimentos armazenados com base nos scripts do R desenvolvidos nas partes dois e três. Os procedimentos armazenados serão executados no servidor para fazer previsões com base em novos dados.

Pré-requisitos

  • IDE do R – Este tutorial usa o RStudio Desktop.

  • RODBC – este driver é usado nos scripts do R que você desenvolverá neste tutorial. Se ele ainda não estiver instalado, instale-o usando o comando R install.packages("RODBC"). Para saber mais sobre o RODBC, confira CRAN – Pacote RODBC.

  • Ferramenta de consulta SQL – este tutorial pressupõe que você está usando o Azure Data Studio. Para obter mais informações, confira Como usar notebooks no Azure Data Studio.

Restaurar o banco de dados de exemplo

O banco de dados de exemplo usado neste tutorial foi salvo em um arquivo .bak de backup de banco de dados para você baixar e usar.

Observação

Se você estiver usando Serviços de Machine Learning em Clusters de Big Data, confira como Restaurar um banco de dados na instância mestra de cluster de Big Data do SQL Server.

  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções em Restaurar um banco de dados de um arquivo de backup no Azure Data Studio, usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou
    • Nomeie o banco de dados de destino como "TutorialDB"
  3. Para verificar se o banco de dados restaurado existe, consulte a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções descritas em Restaurar um banco de dados em uma Instância Gerenciada no SQL Server Management Studio usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou
    • Nomeie o banco de dados de destino como "TutorialDB"
  3. Para verificar se o banco de dados restaurado existe, consulte a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpar os recursos

Se você não continuar com este tutorial, exclua o banco de dados TutorialDB.

Próximas etapas

Na parte um desta série de tutoriais, você concluiu estas etapas:

  • Instalar os pré-requisitos
  • Restaurar um banco de dados de exemplo

Para preparar os dados para o modelo de machine learning, siga a parte dois desta série de tutoriais: