Carga de trabalho para aplicativos de ciência de dados e análise no Visual Studio

A carga de trabalho para aplicativos de ciência de dados e de análise no Visual Studio reúne várias linguagens e suas respectivas distribuições de runtime:

O Python é uma das linguagens de script principais usadas para ciência de dados. O Python é fácil de aprender e tem o suporte de um rico ecossistema de pacotes. Esses pacotes abordam uma ampla variedade de cenários, como aquisição de dados, limpeza, treinamento de modelo, implantação e criação de gráficos. O F# também é uma linguagem do .NET robusta e funcional, adequada a diversas tarefas de processamento de dados.

Captura de tela mostrando o Visual Studio com projetos de código em R, Python e F#.

Instalação da carga de trabalho

A carga de trabalho para aplicativos de ciência de dados e análise está disponível no instalador do Visual Studio em Cargas de Trabalho>Outros conjuntos de ferramentas:

Captura de tela mostrando como selecionar a carga de trabalho para aplicativos de ciência de dados e análise no Instalador do Visual Studio 2022.

Captura de tela mostrando como selecionar a carga de trabalho para aplicativos de ciência de dados e análise no Instalador do Visual Studio 2019.

Por padrão, a carga de trabalho instala as seguintes opções, que você pode modificar na seção de resumo da carga de trabalho no Instalador do Visual Studio:

  • Suporte à linguagem F# da área de trabalho
  • Python:
    • Suporte da linguagem Python
    • Suporte Web do Python
    • Ferramentas de desenvolvimento nativo do Python

Integração ao SQL Server

O SQL Server dá suporte ao uso do Python para análises avançadas diretamente no SQL Server. O suporte ao Python está disponível no SQL Server 2017 CTP 2.0 e posterior.

Aproveite as seguintes vantagens executando o código no local em que os dados já residem:

  • Eliminação da movimentação de dados: em vez de mover dados do banco de dados para o aplicativo ou modelo, é possível compilar aplicativo ou modelo no banco de dados. Essa funcionalidade elimina os obstáculos de segurança, conformidade, governança e integridade, bem como uma série de problemas semelhantes relacionados à movimentação de grandes quantidades de dados. Também é possível consumir conjuntos de dados que não se ajustam à memória de uma máquina cliente.

  • Fácil implantação: depois de ter um modelo pronto, implantá-lo na produção é uma simples questão de incorporar o modelo em um script de T-SQL. Os aplicativos cliente SQL codificados em qualquer linguagem poderão aproveitar os modelos e a inteligência por meio de uma chamada de procedimento armazenado. Nenhuma integração de linguagem específica é necessária.

  • Desempenho e escala de nível empresarial: você pode usar as funcionalidades avançadas do SQL Server, como tabelas na memória e índices de armazenamento de colunas, com as APIs escalonáveis de alto desempenho nos pacotes RevoScale. Eliminar a movimentação de dados também significa evitar restrições de memória do cliente à medida que os dados aumentam ou que você deseja aumentar o desempenho do aplicativo.

  • Extensibilidade avançada: você pode instalar e executar quaisquer pacotes de software livre no SQL Server para compilar aplicativos de aprendizado profundo e de inteligência artificial em grandes quantidades de dados no SQL Server. A instalação de um pacote no SQL Server é tão simples quanto instalar um pacote no computador local.

  • Ampla disponibilidade sem custo adicional: as integrações ade linguagem estão disponíveis em todas as edições do SQL Server 2017 e posterior, incluindo a edição Express.

Instalação de integração do SQL Server

Para aproveitar ao máximo a integração ao SQL Server, use o Instalador do Visual Studio para instalar a carga de trabalho em Cargas de trabalho>Outros Conjuntos de Ferramentas>Armazenamento e processamento de dados. Selecione a opção SQL Server Data Tools para habilitar o destaque de sintaxe e a implantação do SQL IntelliSense.

Captura de tela mostrando como selecionar a carga de trabalho para armazenamento e processamento de dados no Instalador do Visual Studio 2022.

Captura de tela mostrando como selecionar a carga de trabalho para armazenamento e processamento de dados no Instalador do Visual Studio 2019.

Para obter mais informações, confira Python in SQL Server 2017: Enhanced in-database machine learning (blog).

Outros serviços e SDKs

Além do que está diretamente na carga de trabalho para aplicativos de ciência de dados e de análise, o Notebooks no Visual Studio Code e o SDK do Azure para Python também são úteis para ciência de dados.

O SDK do Azure para Python facilita o consumo e gerenciamento de serviços do Microsoft Azure em aplicativos executados no Windows, Mac e Linux. Para obter mais informações, confira Azure para desenvolvedores Python.

Você pode combinar a extensão do Jupyter com Notebooks no Visual Studio Code para dar suporte ao desenvolvimento do Jupyter e aprimorar seu projeto com extensões de linguagem extras. Como introdução, o serviço inclui blocos de anotações de exemplo em Python, em R e em F#. Para obter mais informações, confira Experiências de notebooks da Microsoft e GitHub.

Captura de tela mostrando o uso de notebooks com Jupyter em uma introdução à amostra de R.