Lezione 1: Creare un progetto e un pacchetto di base con SQL Server Integration Services (SSIS)

Si applica a:SQL Server SSIS Integration Runtime in Azure Data Factory

In questa lezione, viene creato un semplice pacchetto di estrazione, trasformazione e caricamento (ETL). Il pacchetto estrae i dati da un'unica origine file flat, li trasformai usando due trasformazioni Ricerca e scrive i dati trasformati in una copia della tabella dei fatti FactCurrencyRate del database di esempio AdventureWorksDW2022. In questa lezione si apprenderà come creare nuovi pacchetti, aggiungere e configurare connessioni origine e destinazione dati e usare nuovi componenti flusso di controllo e flusso di dati.

Prima di creare un pacchetto è necessario conoscere bene la formattazione usata nei dati di origine e nella destinazione. Ora sarà possibile definire le trasformazioni necessarie per eseguire il mapping tra i dati di origine e la destinazione.

Prerequisiti

Questa esercitazione si basa su Microsoft SQL Server Data Tools, un set di pacchetti di esempio e un database di esempio.

Esaminare i dati di origine

In questa esercitazione i dati di origine sono costituiti da dati valutari cronologici all'interno del file flat SampleCurrencyData.txt. I dati di origine sono contenuti nelle quattro colonne seguenti: il tasso medio della valuta, un codice valuta, un codice data e il tasso di fine giornata.

Ecco un esempio dei dati di origine presenti nel file SampleCurrencyData.txt:

1.00070049USD9/3/05 0:001.001201442  
1.00020004USD9/4/05 0:001  
1.00020004USD9/5/05 0:001.001201442  
1.00020004USD9/6/05 0:001  
1.00020004USD9/7/05 0:001.00070049  
1.00070049USD9/8/05 0:000.99980004  
1.00070049USD9/9/05 0:001.001502253  
1.00070049USD9/10/05 0:000.99990001  
1.00020004USD9/11/05 0:001.001101211  
1.00020004USD9/12/05 0:000.99970009

Quando si usano dati di origine file flat, è importante capire in che modo Gestione connessione file flat interpreta i dati dei file di questo tipo. Se l'origine del file flat è Unicode, tutte le colonne vengono definite nella gestione connessione file flat come [DT_WSTR] con una larghezza predefinita di 50. Se la codifica dell'origine file flat è ANSI, le colonne sono definite come [DT_STR] con una larghezza predefinita pari a 50. Sarà probabilmente necessario cambiare le impostazioni predefinite per adattare meglio i tipi di colonna stringa ai dati. È necessario esaminare il tipo di dati della destinazione e quindi scegliere il tipo corrispondente all'interno di Gestione connessione file flat.

Esaminare i dati di destinazione

La destinazione dei dati di origine è una copia della tabella dei fatti FactCurrencyRate in AdventureWorksDW2022. La tabella FactCurrencyRate presenta quattro colonne ed ha relazioni con due tabelle delle dimensioni, come illustrato nella tabella seguente.

Nome colonna Tipo di dati Tabella di ricerca Colonna di ricerca
AverageRate float None None
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
DateKey int (FK) DimDate DateKey (PK)
EndOfDayRate float None None

Eseguire il mapping dei dati di origine alla destinazione

L'analisi dei formati dei dati di origine e di destinazione indica che per i valori CurrencyKey e DateKey sono necessarie ricerche. Le trasformazioni che eseguono queste ricerche ottengono tali valori tramite le chiavi alternative derivate dalle tabelle delle dimensioni DimCurrency e DimDate.

Colonna file flat Nome tabella Nome colonna Tipo di dati
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Argomenti della lezione

In questa lezione sono incluse le attività seguenti:

Inizio della lezione

Passaggio 1: creare un nuovo progetto di Integration Services