Guía del entorno de ejecución de los clústeres de macrodatos de SQL Server para Apache Spark

Artículo
03/20/2023

Se aplica a: SQL Server 2019 (15.x)

Importante

El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.

Presentación del entorno de ejecución de los clústeres de macrodatos de SQL Server para Apache Spark

El entorno de ejecución de los clústeres de macrodatos de SQL Server para Apache Spark es una especificación estandarizada para Apache Spark que permite una interoperabilidad sin problemas entre distribuciones. Este entorno de ejecución de Spark es un bloque coherente y con versiones de distribuciones de lenguajes de programación, optimizaciones de motor, bibliotecas principales y paquetes.

Cada producto que use esta especificación de entorno de ejecución contendrá las mismas versiones de Apache Spark Core, PySpark, Scala Spark, Spark.R, sparklyr y .NET para Spark.

Todos los paquetes y bibliotecas distribuidos también son los mismos. Uno de los objetivos principales de la especificación es ofrecer una experiencia de primera clase a los ingenieros y los científicos de datos proporcionando una lista de paquetes y conectores seleccionados y actualizados constantemente y listos para usarse de inmediato.

Ventajas del entorno de ejecución de los clústeres de macrodatos de SQL Server para Apache Spark:

Optimizaciones y características del motor de Spark disponibles en todos los productos y servicios
Ritmo de lanzamientos establecido
Interoperabilidad sin problemas entre productos y servicios de Spark
Paquetes seleccionados para ingenieros y científicos de datos
Caso de administración de paquetes coherente

Ritmo de lanzamientos y estándares de nomenclatura

La especificación del entorno de ejecución de clústeres de macrodatos de SQL Server para Apache Spark define lo siguiente:

El estándar de nomenclatura del entorno de ejecución es el siguiente:

"PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE# "

El ejemplo es "BDC.3.2021.1".

RELEASE# es un número semántico secuencial. No está enlazado a meses ni a ningún otro estándar. Una vez creada una versión en tiempo de ejecución, es inmutable. Cada versión de los clústeres de macrodatos de SQL Server se incluye con una versión del tiempo de ejecución.

¿Qué hay en la versión en tiempo de ejecución actual?

Las notas de la versión de la plataforma de los clústeres de macrodatos de SQL Server tienen el nombre del entorno de ejecución y el contenido completo de la versión.

Pasos siguientes

Para obtener más información, consulte Presentación de Clústeres de macrodatos de SQL Server.