Spostare dati da o verso un archivio BLOB di Azure con connettori SSIS

Azure Feature Pack per Integration Services (SSIS) fornisce componenti per la connessione ad Azure, il trasferimento di dati tra Azure e origini dati locali e l'elaborazione di dati archiviati in Azure.

Questo menu contiene collegamenti alle tecnologie che è possibile usare per spostare dati da e verso un archivio BLOB di Azure:

Dopo che i clienti hanno spostato i dati locali nel cloud, possono accedere ai dati da qualsiasi servizio di Azure per sfruttare al meglio la gamma di tecnologie di Azure. I dati potrebbero essere usati successivamente, ad esempio in Azure Machine Learning o in un cluster HDInsight.

Per alcuni esempi dell'uso di queste risorse di Azure, vedere le procedure dettagliate su SQL e HDInsight.

Per informazioni sugli scenari classici che usano SSIS per soddisfare esigenze aziendali comuni in scenari di integrazione dei dati ibridi, vedere il blog relativo ai vantaggi offerti da SQL Server Integration Services Feature Pack for Azure .

Nota

Per un'introduzione completa alle Archiviazione BLOB di Azure, vedere Nozioni di base sul BLOB di Azure e all'API REST del servizio BLOB di Azure.

Prerequisiti

Per eseguire le attività illustrate in questo articolo, è necessario aver configurato una sottoscrizione di Azure e un account di archiviazione di Azure. Per caricare o scaricare dati, è necessario fornire il nome dell'account di archiviazione di Azure e la chiave dell'account.

Per usare i connettori SSISè necessario scaricare:

Nota

SSIS viene installato con SQL Server, ma non è incluso nella versione Express. Per informazioni sulle applicazioni incluse in varie edizioni di SQL Server, vedere la documentazione tecnica di SQL Server

Per installare SSIS, vedere Installare Integration Services (SSIS)

Per informazioni su come iniziare a usare SISS per creare semplici pacchetti di estrazione, trasformazione e caricamento (ETL), vedere Esercitazione su SSIS: Creazione di un semplice pacchetto ETL.

Scaricare il set di dati NYC Taxi

L'esempio descritto qui usa un set di dati disponibile pubblicamente, disponibile nei set di dati aperti di Azure e nei dati dei record di viaggio TLC. Il set di dati è costituito da circa 173 milioni di corse su taxi a NYC nell'anno 2013. Sono disponibili due tipi di dati: i dettagli sul tragitto e i dettagli sul costo del tragitto.

Caricare i dati nell'archiviazione BLOB

Per spostare i dati usando il Feature Pack SSIS dall'ambiente locale all'Archiviazione BLOB, si usa un'istanza dell'attività di caricamento BLOB di Azure, illustrata di seguito:

Screenshot that shows Azure Blob Upload Task button.

Nella tabella seguente vengono descritti i parametri usati dall'attività.

Campo Descrizione
AzureStorageConnection Specifica un'istanza esistente di Gestione connessione di Archiviazione di Azure o crea una nuova istanza che fa riferimento a un account di archiviazione di Azure che punta alla posizione in cui sono ospitati i file BLOB.
BlobContainer Specifica il nome del contenitore BLOB che contiene i file caricati come BLOB.
BlobDirectory Specifica la directory BLOB in cui viene archiviato il file caricato come BLOB in blocchi. La directory BLOB è una struttura gerarchica virtuale. Se il BLOB esiste già, viene sostituito.
LocalDirectory Specifica la directory locale che include i file da caricare.
FileName Specifica un filtro per i nomi per la selezione di file con il modello di nomi specificato. Ad esempio, MySheet*.xls* include file come MySheet001.xls e MySheetABC.xlsx
TimeRangeFrom/TimeRangeTo Specifica un filtro basato su un intervallo di tempo. Sono inclusi i file modificati dopo TimeRangeFrom e prima di TimeRangeTo.

Nota

Le credenziali di AzureStorageConnection devono essere corrette e BlobContainer deve essere presente prima del tentativo di trasferimento.

Scaricare dati da Archiviazione BLOB

Per scaricare i dati dal BLOB Archiviazione all'archiviazione locale con SSIS, usare un'istanza dell'attività di download BLOB di Azure.

Scenari di Azure SSIS più avanzati

Il Feature Pack di SSIS consente di gestire flussi più complessi creando pacchetti di attività. Ad esempio, è possibile eseguire il feed dei dati BLOB direttamente in un cluster HDInsight, il cui output può essere scaricato di nuovo in un BLOB e quindi in un archivio locale. SSIS può eseguire processi Hive e Pig in un cluster HDInsight usando connessioni SSIS aggiuntive:

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autore principale:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Passaggi successivi