Eseguire la migrazione degli schemi a SQL Data Warehouse

Indicazioni per la migrazione degli schemi SQL a SQL Data Warehouse.

Pianificare la migrazione dello schema

Per pianificare una migrazione vedere la panoramica delle tabelle per aspetti della creazione delle tabelle come statistiche, distribuzione, partizionamento e indicizzazione. Vengono anche presentate alcune funzionalità non supportate per le tabelle e le soluzioni alternative.

Usare gli schemi definiti dall'utente per consolidare i database

È probabile che carico di lavoro esistente includa più di un database. Ad esempio un data warehouse di SQL Server può includere un database di staging, un database del data warehouse e alcuni database del data mart. In questa topologia ogni database viene eseguito come carico di lavoro separato con criteri di protezione separati.

Al contrario, SQL Data Warehouse esegue tutto il carico di lavoro del data warehouse all'interno di un database. I join tra database non sono consentiti. SQL Data Warehouse prevede pertanto che tutte le tabelle usate dal data warehouse siano archiviate in un unico database.

È consigliabile usare schemi definiti dall'utente per consolidare il carico di lavoro esistente in un unico database. Per esempi, vedere Schemi definiti dall'utente

Usare tipi di dati compatibili

Modificare i tipi di dati in modo che siano compatibili con SQL Data Warehouse. Per l'elenco dei tipi di dati supportati e non supportati, vedere Tipi di dati. L'argomento offre soluzioni alternative per i tipi non supportati. Offre anche una query per identificare i tipi esistenti che non sono supportati in SQL Data Warehouse.

Ridurre al minimo le dimensioni delle righe

Per prestazioni ottimali, ridurre al minimo la lunghezza delle righe delle tabelle. Dato che a righe più brevi corrispondono prestazioni migliori, usare i tipi di dati più brevi che funzionano per i dati.

Per la larghezza della riga della tabella, PolyBase ha un limite pari a 1 MB. Se si prevede di caricare dati in SQL Data Warehouse con PolyBase, aggiornare le tabelle in modo che le righe abbiano una larghezza massima inferiore a 1 MB.

Specificare l'opzione di distribuzione

SQL Data Warehouse è un sistema di database distribuito. Ogni tabella è distribuita o replicata nei nodi di calcolo. Un'opzione della tabella consente di specificare la modalità di distribuzione dei dati. Le scelte disponibili sono round robin, replica o distribuzione hash. Ognuna presenta vantaggi e svantaggi. Se non si specifica l'opzione di distribuzione, SQL Data Warehouse usa round robin come impostazione predefinita.

  • La modalità round robin è la modalità predefinita. È la più semplice da usare e carica i dati alla massima velocità, ma lo spostamento di dati richiesto dai join determina un rallentamento delle prestazioni delle query.
  • Nell'approccio con tabelle replicate, viene archiviata una copia della tabella in ogni nodo di calcolo. Le tabelle replicate sono efficienti perché non richiedono lo spostamento di dati per i join e le aggregazioni. Tuttavia richiedono risorse di archiviazione aggiuntive e di conseguenza sono la scelta migliore per tabelle di dimensioni contenute.
  • La distribuzione hash distribuisce le righe su tutti i nodi tramite una funzione hash. Le tabelle con distribuzione hash sono il nucleo di SQL Data Warehouse e sono progettate per garantire alte prestazioni per le query su tabelle di grandi dimensioni. Questa opzione richiede un certo grado di pianificazione nella scelta della colonna ottimale per la distribuzione dei dati. Se tuttavia al primo tentativo non si sceglie la colonna migliore, è possibile ridistribuire facilmente i dati in base a un'altra colonna.

Per scegliere la migliore opzione di distribuzione per ogni tabella, vedere Tabelle con distribuzione.

Passaggi successivi

Dopo la migrazione dello schema del database a SQL Data Warehouse, passare a uno degli articoli seguenti:

Per altre informazioni, vedere l'articolo con le procedure consigliate di SQL Data Warehouse.