Introduzione al pool master in cluster Big Data di SQL Server

Articolo
03/18/2023

Si applica a: SQL Server 2019 (15.x)

Importante

Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.

Questo articolo descrive il ruolo dell'istanza master di SQL Server in un cluster Big Data di SQL Server. Il pool master contiene l'istanza master di SQL Server. L'istanza master è un'istanza di SQL Server in esecuzione in un cluster Big Data di SQL Server. L'istanza master gestisce connettività, query con scale-out, database utente e metadati e Machine Learning Services.

L'istanza master di SQL Server offre le funzionalità seguenti:

Connettività

L'istanza master di SQL Server fornisce un endpoint TDS accessibile esternamente per il cluster. È possibile connettere applicazioni o strumenti di SQL Server come Azure Data Studio o SQL Server Management Studio a questo endpoint allo stesso modo di qualsiasi altra istanza di SQL Server.

Gestione delle query con scalabilità orizzontale

L'istanza master di SQL Server contiene il motore di query con scalabilità orizzontale usato per distribuire query tra istanze di SQL Server nei nodi del pool di calcolo. Il motore di query con scale-out fornisce anche l'accesso tramite Transact-SQL a tutte le tabelle Hive nel cluster senza configurazioni aggiuntive.

Database di metadati e utente

Oltre ai database di sistema di SQL Server standard, l'istanza master di SQL Server contiene anche:

Un database di metadati che contiene i metadati della tabella HDFS.
Una mappa partizioni del piano dati.
Informazioni dettagliate sulle tabelle esterne che permettono di accedere al piano dati del cluster.
Origini dati esterne e tabelle esterne PolyBase definite nei database utente.

È anche possibile scegliere di aggiungere i propri database utente all'istanza master di SQL Server.

Machine Learning Services

Machine Learning Services per SQL Server è una funzionalità aggiuntiva per il motore di database. Viene usata per l'esecuzione di codice Java, R e Python in SQL Server. Questa funzionalità è basata sul framework di estendibilità di SQL Server, che isola i processi esterni dai processi del motore di base, ma si integra completamente con i dati relazionali come stored procedure, come script T-SQL contenenti istruzioni R o Python o come codice Java, R o Python contenente T-SQL.

Nell'ambito di un cluster Big Data di SQL Server, Machine Learning Services sarà disponibile nell'istanza master di SQL Server per impostazione predefinita. Una volta abilitata l'esecuzione di script esterni nell'istanza master di SQL Server, è possibile eseguire script Java, R e Python usando sp_execute_external_script.

Vantaggi di Machine Learning Services in un cluster Big Data

I cluster Big Data di SQL Server semplificano l'aggiunta di Big Data ai dati dimensionali generalmente archiviati nel database aziendale. Il valore dei Big Data aumenta notevolmente se questi non sono disponibili solo parzialmente in un'organizzazione, ma sono inclusi anche in report, dashboard e applicazioni. Allo stesso tempo, i data scientist possono continuare a usare gli strumenti dell'ecosistema Spark/HDFS e hanno semplice accesso in tempo reale ai dati nell'istanza master di SQL Server e nelle origini dati esterne accessibili tramite l'istanza master di SQL Server.

Con i cluster Big Data di SQL Server è possibile sfruttare di più i data lake aziendali. Sviluppatori e analisti di SQL Server possono eseguire queste operazioni:

Compilare applicazioni che utilizzano dati di data lake aziendali.
Riflettere su tutti i dati con query Transact-SQL.
Usare l'ecosistema esistente di strumenti e applicazioni di SQL Server per accedere ai dati aziendali e analizzarli.
Ridurre la necessità di spostamento dei dati tramite la virtualizzazione dei dati e i data mart.
Continuare a usare Spark per scenari di Big Data.
Compilare applicazioni aziendali intelligenti con Spark o SQL Server per eseguire il training di modelli sui data lake.
Rendere operativi i modelli nei database di produzione per ottenere prestazioni ottimali.
Trasmettere i dati direttamente nei data mart aziendali per l'analisi in tempo reale.
Esplorare visivamente i dati usando analisi interattive e strumenti di business intelligence.

Passaggi successivi

Per altre informazioni sui cluster Big Data di SQL Server, vedere le risorse seguenti: