O que são os Serviços de Machine Learning do SQL Server com Python e R?

Aplica-se a: simSQL Server 2017 (14.x) e SimInstância Gerenciada do Azure SQL mais recente

Os Serviços de Machine Learning são um recurso no SQL Server que possibilita executar scripts do Python e do R usando dados relacionais. Você pode usar pacotes e estruturas de software livre, bem como os pacotes do R e do Python da Microsoft para análise preditiva e aprendizado de máquina. Os scripts são executados no banco de dados sem mover dados para fora do SQL Server ou pela rede. Este artigo explica os conceitos básicos dos Serviços de Machine Learning do SQL Server e como começar.

Observação

Serviços de Machine Learning também estão disponíveis na Instância Gerenciada de SQL do Azure. Para aprendizado de máquina em outras plataformas do SQL, confira a documentação do aprendizado de máquina do SQL.

Observação

Serviços de Machine Learning também estão disponíveis na Instância Gerenciada de SQL do Azure. Para aprendizado de máquina em outras plataformas do SQL, confira a documentação do aprendizado de máquina do SQL.

Para executar o Java no SQL Server, confira a Documentação da Extensão de Linguagem Java.

Para executar o C# no SQL Server, confira a Documentação da Extensão de Linguagem C#.

Executar scripts do Python e do R no SQL Server

Os Serviços de Machine Learning do SQL Server permitem executar scripts de Python e R no banco de dados. Você pode usá-lo para preparar e limpar dados, fazer engenharia de recursos e treinar, avaliar e implantar modelos de machine learning em um banco de dados. O recurso executa seus scripts onde os dados residem e elimina a transferência dos dados pela rede para outro servidor.

Você pode executar scripts de Python e R em uma instância do SQL Server com o procedimento armazenado sp_execute_external_script.

As distribuições base do Python e do R estão incluídas nos Serviços de Machine Learning. Você pode instalar e usar estruturas e pacotes de software livre, como PyTorch, TensorFlow e scikit-learn, além dos pacotes da Microsoft.

Os Serviços de Machine Learning usam uma estrutura de extensibilidade para executar scripts do R e do Python no SQL Server. Saiba mais sobre como isso funciona:

Introdução aos Serviços de Machine Learning

Versões do Python e do R

Confira a seguir as versões do Python e do R incluídas nos Serviços de Machine Learning.

Versão do SQL Server Atualização Cumulativa Versão de runtime do Python Versões de runtime do R
SQL Server 2019 RTM e posterior 3.7.1 3.5.2
Microsoft SQL Server 2017 CU22 e posteriores 3.5.2 e 3.7.2 3.3.3 e 3.5.2
Microsoft SQL Server 2017 RTM – CU21 3.5.2 3.3.3

Para a versão do R no SQL Server 2016, confira a seção de versão do R em O que é o R Services?

Pacotes do Python e do R

Você pode usar pacotes e estruturas de software livre, além dos pacotes corporativos da Microsoft. Os pacotes de software livre do Python e do R mais comuns são pré-instalados nos Serviços de Machine Learning. Os seguintes pacotes do R e do Python da Microsoft também estão incluídos:

Linguagem Pacote Descrição
Python revoscalepy O pacote principal para Python escalonável. Transformações e manipulação de dados, resumo estatístico, visualização e muitas formas de modelagem. Além disso, as funções nesse pacote distribuem automaticamente as cargas de trabalho entre os núcleos disponíveis para processamento paralelo.
Python microsoftml Adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
R RevoScaleR O pacote primário para R escalonável. Transformações e manipulação de dados, resumo estatístico, visualização e muitas formas de modelagem. Além disso, as funções nesse pacote distribuem automaticamente as cargas de trabalho entre os núcleos disponíveis para processamento paralelo.
R MicrosoftML (R) Adiciona algoritmos de aprendizado de máquina para criar modelos personalizados para análise de texto, análise de imagem e análise de sentimentos.
R olapR As funções do R usadas para consultas MDX em um cubo OLAP do SQL Server Analysis Services.
R sqlrutils Um mecanismo para usar scripts do R em um procedimento armazenado do T-SQL, registrar esse procedimento armazenado em um banco de dados e executar procedimento armazenado em um ambiente de desenvolvimento em R.
R Microsoft R Open O MRO (Microsoft R Open) é a distribuição aprimorada do R da Microsoft. É uma plataforma de software livre completa para análise estatística e ciência de dados. Ela é baseada e totalmente compatível com o R e inclui recursos adicionais para melhorar o desempenho e a capacidade de reprodução.

Para obter mais informações sobre quais pacotes são instalados com os Serviços de Machine Learning e como instalar outros pacotes, confira:

Próximas etapas