Carga de trabajo Aplicaciones de ciencia de datos y de análisis en Visual Studio

La carga de trabajo Aplicaciones de ciencia de datos y de análisis de Visual Studio reúne varios lenguajes y sus correspondientes distribuciones de runtime:

Python es un lenguaje de scripting fundamental que se usa para la ciencia de datos. Python es fácil de aprender y es compatible con un ecosistema completo de paquetes. Estos paquetes se centran en una amplia gama de escenarios, como la adquisición de datos, limpieza, entrenamiento de modelos, implementación y trazado. F# también es un lenguaje de .NET eficaz y esencialmente funcional que resulta aplicable para una amplia variedad de tareas de procesamiento de datos.

Captura de pantalla donde aparece Visual Studio con proyectos de código de R, Python y F#.

Instalación de cargas de trabajo

La carga de trabajo Aplicaciones de ciencia de datos y de análisis está disponible en el Instalador de Visual Studio en Cargas de trabajo>Otros conjuntos de herramientas:

Captura de pantalla donde se indica cómo seleccionar la carga de trabajo Aplicaciones de ciencia de datos y de análisis en el Instalador de Visual Studio 2022.

Captura de pantalla donde aparece cómo seleccionar la carga de trabajo Aplicaciones de ciencia de datos y de análisis en el Instalador de Visual Studio 2019.

De forma predeterminada, la carga de trabajo instala las opciones siguientes, que se pueden modificar en la sección de resumen de la carga de trabajo en el Instalador de Visual Studio:

  • Compatibilidad con el lenguaje de escritorio F#
  • Python:
    • Compatibilidad con el lenguaje Python
    • Compatibilidad web con Python
    • Herramientas de desarrollo nativo de Python

Integración de SQL Server

SQL Server admite el uso de Python para realizar análisis avanzados directamente dentro de SQL Server. La compatibilidad con Python está disponible en SQL Server 2017 CTP 2.0 y versiones posteriores.

Ejecutar este código donde ya se encuentran los datos le ofrece una serie de ventajas:

  • Eliminación del movimiento de los datos: en lugar de mover datos de la base de datos a la aplicación o el modelo, puede crear aplicaciones en la base de datos. Esta función elimina las barreras de seguridad, cumplimiento normativo, gobernanza, integridad y una gran cantidad de problemas similares relacionados con el movimiento de grandes cantidades de datos. También puede consumir conjuntos de datos que no quepan en la memoria de un equipo cliente.

  • Implementación sencilla: una vez que tenga listo un modelo, implementarlo en producción es tan sencillo como insertar el modelo en un script de T-SQL. Después, cualquier aplicación cliente SQL escrita en cualquier lenguaje puede aprovechar las ventajas de los modelos y la inteligencia mediante una llamada de procedimiento almacenado. No se necesitan integraciones específicas del lenguaje.

  • Rendimiento y escala de nivel empresarial: puede usar funciones avanzadas de SQL Server como los índices de almacenamiento de tablas y columnas en memoria con las API escalables de alto rendimiento de los paquetes de RevoScale. La eliminación del movimiento de datos también significa que se evitan las restricciones de memoria de cliente a medida que crecen los datos o que se quiere aumentar el rendimiento de la aplicación.

  • Extensibilidad amplia: puede instalar y ejecutar cualquiera de los paquetes de código abierto más recientes en SQL Server para compilar aplicaciones completas de IA y aprendizaje profundo en grandes cantidades de datos en SQL Server. Instalar un paquete en SQL Server es tan sencillo como instalar un paquete en el equipo local.

  • Amplia disponibilidad sin costo adicional: hay integraciones de lenguaje disponibles en todas las ediciones de SQL Server 2017 y versiones posteriores, incluida la edición Express.

Instalación de la integración de SQL Server

Para aprovechar al máximo la integración de SQL Server, use el Instalador de Visual Studio para instalar la carga de trabajo Cargas de trabajo>Otros conjuntos de herramientas>Almacenamiento y procesamiento de datos. Seleccione la opción SQL Server Data Tools para habilitar SQL IntelliSense, el resaltado de sintaxis y la implementación.

Captura de pantalla que muestra cómo seleccionar la carga de trabajo Almacenamiento y procesamiento de datos en el Instalador de Visual Studio 2022.

Captura de pantalla donde aparece cómo seleccionar la carga de trabajo Almacenamiento y procesamiento de datos en el Instalador de Visual Studio 2019.

Para obtener más información, consulte Python en SQL Server 2017: aprendizaje automático mejorado en bases de datos (blog).

Otros servicios y SDK

Además de lo que se incluye directamente en la carga de trabajo Aplicaciones de ciencia de datos y de análisis, el servicio Notebooks en Visual Studio Code y el SDK de Azure para Python también son útiles para la ciencia de datos.

Azure SDK para Python facilita el uso y la administración de los servicios de Microsoft Azure en aplicaciones que se ejecutan en Windows, Mac y Linux. Para obtener más información, consulte Azure para desarrolladores de Python.

Puede combinar la extensión Jupyter con Notebooks en Visual Studio Code para admitir el desarrollo de Jupyter y mejorar el proyecto con extensiones de lenguaje adicionales. El servicio incluye blocs de notas de ejemplo de Python, R y F# para que pueda comenzar. Para obtener más información, consulte Experiencias de Notebooks de Microsoft y GitHub.

Captura de pantalla donde se observa el uso de Notebooks con Jupyter en un ejemplo de introducción a R.