Guida al runtime dei cluster Big Data di SQL Server per Apache Spark

Articolo
03/12/2024

Si applica a: SQL Server 2019 (15.x)

Importante

Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.

Introduzione al runtime dei cluster Big Data di SQL Server per Apache Spark

Il runtime di cluster Big Data di SQL Server per Apache Spark è una specifica standardizzata per Apache Spark che consente un'interoperabilità senza problemi tra le distribuzioni. Questo runtime di Spark è un blocco coerente e con controllo delle versioni delle distribuzioni del linguaggio di programmazione, ottimizzazioni del motore, librerie di base e pacchetti.

Ogni prodotto che usa questa specifica di runtime conterrà le stesse versioni di Apache Spark Core, PySpark, Scala Spark, Spark.R, sparklyr e .NET per Spark.

Anche tutti i pacchetti e le librerie distribuiti sono gli stessi. Uno degli obiettivi principali per la specifica è quello di offrire un'esperienza di alto livello per ingegneri dei dati e scienziati dei dati offrendo un elenco predefinito costantemente curato e aggiornato di pacchetti e connettori.

Vantaggi del runtime dei cluster Big Data di SQL Server per Apache Spark:

Ottimizzazioni e funzionalità del motore Spark disponibili in tutti i prodotti e servizi
Frequenza delle release stabilita
Interoperabilità senza problemi tra prodotti e servizi Spark
Pacchetti curati per ingegneri dei dati e scienziati dei dati
Cronologia coerente della gestione dei pacchetti

Frequenza delle release e standard di denominazione

La specifica runtime di cluster Big Data di SQL Server per Apache Spark definisce quanto segue:

Lo standard di denominazione del runtime è il seguente:

"PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE#"

L'esempio è "BDC.3.2021.1".

RELEASE# è un numero semantico sequenziale. Non è vincolato a mesi o ad altri standard. Dopo aver creato una versione di runtime, questa non è modificabile. Ogni versione dei cluster Big Data di SQL Server viene fornita con una versione del runtime.

Che cosa offre la versione di runtime corrente?

Le note sulla versione della piattaforma Cluster Big Data di SQL Server contengono il nome del runtime e il contenuto completo della versione.

Passaggi successivi

Per altre informazioni, vedere Introduzione ai cluster Big Data di SQL Server.