Рабочая нагрузка для обработки и анализа данных в Visual Studio

Рабочая нагрузка по обработке и анализу данных в Visual Studio объединяет несколько языков и их соответствующих дистрибутивов среды выполнения:

Python — это основной язык скриптов, используемый для обработки и анализа данных. Python легко узнать и получить поддержку из богатой экосистемы пакетов. Эти пакеты позволяют реализовать широкий спектр сценариев, таких как получение данных, очистка, обучение модели, развертывания и построение графиков. F# также является мощным функциональным языком .NET, применимым для различных задач обработки данных.

Снимок экрана: Visual Studio с проектами кода R, Python и F#.

Установка рабочей нагрузки

Рабочая нагрузка для обработки и анализа данных доступна в установщике Visual Studio в разделе "Другие наборы инструментов" для рабочих>нагрузок:

Снимок экрана: выбор рабочей нагрузки приложений для обработки и анализа данных в Visual Studio Installer 2022.

Снимок экрана: выбор рабочей нагрузки приложений для обработки и анализа данных в Установщике Visual Studio 2019.

По умолчанию рабочая нагрузка устанавливает следующие параметры, которые можно изменить в разделе сводки для рабочей нагрузки в Установщике Visual Studio:

  • Поддержка языка F# для классических приложений
  • Python:
    • Поддержка языка Python
    • Поддержка веб-приложений Python
    • Встроенные средства разработки Python

Интеграция с SQL Server

SQL Server поддерживает использование Python для углубленной аналитики внутри SQL Server. Поддержка Python доступна в SQL Server 2017 CTP 2.0 и более поздних версий.

Возможность запускать код там же, где находятся ваши данные, обеспечивает следующие преимущества.

  • Отказ от перемещения данных: вместо перемещения данных из базы данных в приложение или модель вы можете создавать приложения в базе данных. Эта возможность устраняет барьеры безопасности, соответствия, управления, целостности и ряда аналогичных проблем, связанных с перемещением больших объемов данных. Вы также можете использовать наборы данных, которые не вписываются в память клиентского компьютера.

  • Простое развертывание. После подготовки модели развертывание в рабочей среде является простым вопросом внедрения модели в скрипт T-SQL. Любое клиентское приложение SQL, написанное на любом языке, может воспользоваться преимуществами моделей и аналитики через вызов хранимой процедуры. Никакие отдельные интеграции языка при этом не требуются.

  • Производительность и масштабирование корпоративного уровня: вы можете использовать расширенные возможности SQL Server, такие как таблица в памяти и индексы хранилища столбцов с высокопроизводительными масштабируемыми API в пакетах RevoScale. Устранение перемещения данных также означает, что вы избегаете ограничений памяти клиента по мере роста или повышения производительности приложения.

  • Полноценная расширяемость: вы можете установить и запустить в SQL Server любой из последних пакетов с открытым исходным кодом, чтобы создать приложения углубленного обучения и искусственного интеллекта на базе огромного объема данных в SQL Server. Установка пакета в SQL Server осуществляется также просто, как и на локальном компьютере.

  • Широкая доступность без дополнительных затрат: интеграции языков доступны во всех выпусках SQL Server 2017 и более поздних версий, включая экспресс-выпуск.

Установка интеграции SQL Server

Чтобы воспользоваться всеми преимуществами интеграции SQL Server, используйте Установщик Visual Studio для установки рабочей нагрузки других наборов>>инструментов хранилища данных и обработки. Выберите параметр SQL Server Data Tools, чтобы включить IntelliSense SQL, выделение синтаксиса и развертывание:

Снимок экрана: выбор рабочей нагрузки хранилища данных и обработки в Visual Studio Installer 2022.

Снимок экрана: выбор рабочей нагрузки хранилища данных и обработки в Visual Studio Installer 2019.

Дополнительные сведения см. в статье Python в SQL Server 2017: расширенное машинное обучение в базе данных (блог).

Другие службы и пакеты SDK

Помимо рабочих нагрузок приложений для обработки и анализа данных, записные книжки в Visual Studio Code и пакете SDK Azure для Python также полезны для обработки и анализа данных.

Пакет SDK Azure для Python — это удобное средство для работы со службами Microsoft Azure из приложений Windows, Mac и Linux. Дополнительные сведения см. в статье Azure для разработчиков Python.

Расширение Jupyter можно объединить с записными книжками в Visual Studio Code для поддержки разработки Jupyter и улучшения проекта с дополнительными расширениями языка. Эта служба содержит примеры записных книжек на языках Python, R и F#, с которых можно начать работу. Дополнительные сведения см. в статье "Записные книжки" от Майкрософт и GitHub.

Снимок экрана: использование записных книжек с Jupyter в примере R.