Comprendere le funzionalità e i casi d'uso dei pool SQL serverless di Azure Synapse

Completato

Azure Synapse Analytics è un servizio di analisi integrato che riunisce un'ampia gamma di tecnologie di uso comune per l'elaborazione e l'analisi dei dati su larga scala. Una delle tecnologie più diffuse usate nelle soluzioni di dati è SQL, un linguaggio standard del settore per l'esecuzione di query e la manipolazione dei dati.

Pool SQL serverless in Azure Synapse Analytics

Azure Synapse SQL è un sistema di query distribuito in Azure Synapse Analytics che offre due tipi di ambienti di runtime:

  • Pool SQL serverless: elaborazione di query SQL su richiesta, usata principalmente per lavorare con i dati in un data lake.
  • Pool SQL dedicato: istanze di database relazionali su scala enterprise utilizzata per ospitare data warehouse in cui i dati sono archiviati nelle tabelle relazionali.

In questo modulo, si tratterà principalmente il pool SQL serverless, che fornisce un endpoint di pagamento per query per eseguire query sui dati nel data lake. I vantaggi dell'utilizzo del pool SQL serverless includono:

  • Una sintassi Transact-SQL familiare per l'esecuzione di query sui dati sul posto, senza la necessità di copiare i dati o caricarli in un archivio specializzato.
  • Connettività integrata da un’ampia gamma di strumenti di business intelligence e query ad hoc, inclusi i driver più diffusi.
  • Elaborazione di query distribuita creata per dati su larga scala e funzioni computazionali, con prestazioni di query elevate.
  • Una tolleranza di errore incorporata per l'esecuzione di query, che garantisce un'affidabilità elevata e alte percentuali di successo anche per query a esecuzione prolungata che coinvolgono set di dati di grandi dimensioni.
  • Nessuna infrastruttura da configurare o cluster da gestire. Un endpoint incorporato per questo servizio è disponibile in ogni area di lavoro di Azure Synapse, quindi è possibile iniziare a eseguire query sui dati non appena viene creata l'area di lavoro.
  • Nessun addebito per le risorse riservate, vengono addebitati solo i dati elaborati dalle query eseguite.

Quando usare i pool SQL serverless

Il pool SQL serverless è personalizzato per l'esecuzione di query sui dati che risiedono nel data lake, quindi, oltre a eliminare il carico di gestione, elimina la necessità di inserire i dati nel sistema. È sufficiente puntare la query ai dati già presenti nel Lake ed eseguirla.

Il modello di risorse serverless Synapse SQL è ideale per carichi di lavoro non pianificati o "espandibili" che possono essere elaborati usando l'endpoint SQL serverless sempre attivo nell'area di lavoro di Azure Synapse Analytics. L'uso del pool serverless è utile quando è necessario conoscere il costo esatto di ogni query eseguita per monitorare e attribuire i costi.

Nota

Il pool SQL serverless è un sistema di analisi e non è consigliabile per carichi di lavoro OLTP come i database usati dalle applicazioni per archiviare i dati transazionali. I carichi di lavoro che richiedono tempi di risposta in millisecondi e che cercano di individuare una singola riga in un set di dati non sono adatti per il pool SQL serverless.

I casi d'uso più comuni per pool SQL serverless includono:

  • L’esplorazione dei dati consente di sfogliare il data lake e ottenere informazioni dettagliate iniziali sui dati, operazione facilmente eseguibile con Azure Synapse Studio. È possibile sfogliare i file nello spazio di archiviazione del data lake collegato e usare il pool SQL serverless per generare automaticamente uno script SQL per selezionare le PRIME 100 righe da un file o una cartella proprio come si farebbe con una tabella in SQL Server. Da qui è possibile applicare proiezioni, filtri, raggruppamenti e la maggior parte delle operazioni sui dati come se i dati si trovassero in una normale tabella SQL Server.
  • Trasformazione dei dati: sebbene Azure Synapse Analytics fornisca ottime funzionalità di trasformazione dei dati con Synapse Spark, alcuni data engineer potrebbero trovare più semplice ottenere la trasformazione dei dati tramite SQL. Il pool SQL serverless consente di eseguire trasformazioni di dati basate su SQL, in modo interattivo o come parte di una pipeline di dati automatizzata.
  • Data warehouse logico: dopo l'esplorazione iniziale dei dati nel data lake, è possibile definire oggetti esterni, ad esempio tabelle e visualizzazioni, in un database SQL serverless. I dati rimangono archiviati nei file del data lake, ma sono astratti da uno schema relazionale che può essere utilizzato da applicazioni client e strumenti analitici per eseguire query sui dati come in un database relazionale ospitato in SQL Server.