Esercitazione: Creare una pipeline con l'attività di copia usando la Copia guidata di Data Factory

Questa esercitazione illustra come usare la copia guidata per copiare i dati da un archivio BLOB di Azure a un database SQL di Azure.

La copia guidata di Azure Data Factory consente di creare rapidamente una pipeline di dati che copia i dati da un archivio dati di origine supportato a un archivio dati di destinazione supporto. È quindi consigliabile usare la procedura guidata come primo passaggio per creare una pipeline di esempio per lo scenario di spostamento dei dati. Per un elenco degli archivi dati supportati come origini e come destinazioni, vedere gli archivi dati supportati.

Questa esercitazione illustra come creare una data factory di Azure, avviare la Copia guidata ed eseguire una serie di passaggi per specificare i dettagli relativi allo scenario di inserimento/spostamento dei dati. Al termine dei passaggi della procedura guidata, verrà creata automaticamente una pipeline con un'attività di copia per copiare i dati da un archivio BLOB di Azure a un database SQL di Azure. Per altre informazioni sull'attività di copia, vedere le attività di spostamento dei dati.

Prerequisiti

Prima di eseguire questa esercitazione, completare i prerequisiti indicati nella panoramica dell'esercitazione .

Creare un'istanza di Data Factory

In questo passaggio viene usato il portale di Azure per creare un'istanza di Azure Data Factory denominata ADFTutorialDataFactory.

  1. Accedere al portale di Azure.
  2. Fare clic su + NUOVO nell'angolo in alto a sinistra e quindi su Dati e analisi e su Data Factory.

    Nuovo->DataFactory

  3. Nel pannello Nuova data factory :

    1. Immettere ADFTutorialDataFactory come nome. È necessario specificare un nome univoco globale per l'istanza di Azure Data Factory. Se viene visualizzato l'errore Data factory name “ADFTutorialDataFactory” is not available, modificare il nome della data factory, ad esempio, nomeutenteADFTutorialDataFactoryAAAAMMGG, e provare di nuovo a crearla. Per informazioni sulle regole di denominazione per gli elementi di Data Factory, vedere l'argomento Azure Data Factory - Regole di denominazione .

      Nome di data factory non disponibile

    2. Selezionare la sottoscrizionedi Azure.
    3. In Gruppo di risorse eseguire una di queste operazioni:

      • Selezionare Usa esistente per scegliere un gruppo di risorse esistente.
      • Selezionare Crea nuovo per immettere un nome per un gruppo di risorse.

        Alcuni dei passaggi di questa esercitazione presuppongono l'uso del nome ADFTutorialResourceGroup per il gruppo di risorse. Per informazioni sui gruppi di risorse, vedere l'articolo relativo all' uso di gruppi di risorse per la gestione delle risorse di Azure.

    4. Selezionare una località per la data factory.
    5. Selezionare la casella di controllo Aggiungi al dashboard nella parte inferiore del pannello.
    6. Fare clic su Crea.

      Pannello Nuova data factory

  4. Al termine della creazione verrà visualizzato il pannello Data factory, come illustrato nell'immagine seguente:

    Home page di Data factory

Avviare la Copia guidata

  1. Nel pannello Data Factory fare clic su Copia dati (ANTEPRIMA) per avviare Copy Wizard (Copia guidata).

    Nota

    Se il Web browser è bloccato su "Concessione autorizzazioni in corso...", disabilitare/deselezionare l'impostazione Block third party cookies and site data (Blocca cookie e dati del sito di terze parti) nelle impostazioni del browser oppure lasciarla abilitata e creare un'eccezione per login.microsoftonline.com e quindi provare di nuovo ad avviare la procedura guidata.

  2. Nella pagina Proprietà :

    1. Immettere CopyFromBlobToAzureSql per Nome attività.
    2. Immettere una descrizione (facoltativo).
    3. Modificare Start date time (Data e ora di inizio) ed End date time (Data e ora di fine) in modo che la data di fine corrisponda alla data odierna e la data di inizio a cinque giorni prima.
    4. Fare clic su Avanti.

      Strumento di copia - Pagina Proprietà

  3. Nella pagina Source data store (Archivio dati di origine) fare clic sul riquadro Archivio BLOB di Azure. Usare questa pagina per specificare l'archivio dati di origine per l'attività di copia.

    Strumento di copia - Pagina Archivio dati di origine

  4. Nella pagina Specify the Azure Blob storage account (Specificare l'account di archiviazione BLOB di Azure):

    1. Immettere AzureStorageLinkedService per Nome del servizio collegato.
    2. Verificare che in Account selection method (Metodo di selezione dell'account) sia selezionata l'opzione From Azure subscriptions (Da sottoscrizioni di Azure).
    3. Selezionare la sottoscrizionedi Azure.
    4. Selezionare un Account di archiviazione di Azure nell'elenco di quelli disponibili nella sottoscrizione selezionata. È anche possibile scegliere di immettere manualmente le impostazioni dell'account di archiviazione, selezionando l'opzione Immetti manualmente per Account selection method (Metodo di selezione dell'account), quindi fare clic su Avanti.

      Strumento di copia - Specificare l'account di archiviazione BLOB di Azure

  5. Nella pagina Choose the input file or folder (Scegliere il file o la cartella di input):

    1. Fare doppio clic sulla cartella adftutorial.
    2. Selezionare emp.txt e fare clic su Scegli.

      Strumento di copia - Scegliere il file o la cartella di input

  6. Nella pagina Choose the input file or folder (Scegliere il file o la cartella di input) fare clic su Next (Avanti). Non selezionare Binary copy(Copia binaria).

    Strumento di copia - Scegliere il file o la cartella di input

  7. Nella pagina File format settings (Impostazioni di formato file) vengono visualizzati i delimitatori e lo schema rilevati automaticamente dalla procedura guidata analizzando il file. È anche possibile immettere i delimitatori manualmente per sostituirli o interrompere il rilevamento automatico nella Copia guidata. Dopo aver esaminato i delimitatori e i dati di anteprima, fare clic su Next (Avanti).

    Strumento di copia - Impostazioni di formattazioni del file

  8. Nella pagina Destination data store (Archivio dati di destinazione) selezionare Azure SQL Database (Database SQL di Azure) e quindi fare clic su Next (Avanti).

    Strumento di copia - Scegliere l'archivio di destinazione

  9. Nella pagina Specify the Azure SQL database (Specificare il database SQL di Azure):

    1. Immettere AzureSqlLinkedService nel campo Connection name (Nome connessione).
    2. Verificare che in Server / database selection method (Metodo di selezione del server/database) sia selezionata l'opzione From Azure subscriptions (Da sottoscrizioni di Azure).
    3. Selezionare la sottoscrizionedi Azure.
    4. Selezionare Nome server e Database.
    5. Immettere un Nome utente e una Password.
    6. Fare clic su Avanti.

      Strumento di copia - Specificare il database SQL di Azure

  10. Nella pagina Mapping tabella selezionare emp dall'elenco a discesa per il campo Destinazione, fare clic sulla freccia giù (facoltativo) per visualizzare lo schema e l'anteprima dei dati.

    Strumento di copia - Mapping tabella

  11. Nella pagina Mapping dello schema fare clic su Avanti.

    Strumento di copia - Mapping dello schema

  12. Nella pagina Prestazioni fare clic su Avanti.

    Strumento di copia - Impostazioni relative alle prestazioni

  13. Verificare le informazioni nella pagina Riepilogo e fare clic su Fine. La procedura guidata crea due servizi collegati, due set di dati (input e output) e una pipeline nella data factory da cui è stata avviata la Copia guidata.

    Strumento di copia - Impostazioni relative alle prestazioni

Avviare l'applicazione di monitoraggio e gestione

  1. Nella pagina Distribuzione fare clic sul collegamento: Click here to monitor copy pipeline.

    Strumento di copia - La distribuzione è riuscita

  2. L'applicazione di monitoraggio viene avviata in una scheda separata del Web browser.

    App di monitoraggio

  3. Per visualizzare lo stato più recente delle sezioni orarie, fare clic sul pulsante Aggiorna nell'elenco ACTIVITY WINDOWS (Finestre attività) nella parte inferiore. Vengono visualizzate cinque finestre attività relative a cinque giorni compresi tra le ore di inizio e di fine della pipeline. L'elenco non viene aggiornato automaticamente, quindi potrebbe essere necessario fare clic su Aggiorna un paio di volte prima di visualizzare tutte le finestre attività con lo stato Pronto.
  4. Selezionare una finestra attività nell'elenco. Visualizzarne i dettagli in Activity Window Explorer (Esplora finestre attività) a destra.

    Dettagli finestra attività

    Si noti che le date 11, 12, 13, 14 e 15 sono di colore verde per indicare che le sezioni di output giornaliere di queste date sono già stata generate. Questa codifica a colori viene usata anche nella pipeline e nel set di dati di output nella vista diagramma. Nel passaggio precedente si noti che due sezioni sono già state generate, una sezione è attualmente in fase di elaborazione e le altre due sono in attesa di essere elaborate (in base alla codifica a colori).

    Per altre informazioni sull'uso di questa applicazione, vedere l'articolo Monitorare e gestire le pipeline di Azure Data Factory con l'app di monitoraggio e gestione.

Passaggi successivi

In questa esercitazione sono stati usati l'archivio BLOB di Azure come archivio dati di origine e un database SQL di Azure come archivio dati di destinazione in un'operazione di copia. La tabella seguente contiene un elenco degli archivi dati supportati come origini e come destinazioni dall'attività di copia:

Categoria Archivio dati Supportato come origine Supportato come sink
Azure Archivio BLOB di Azure
  Azure Cosmos DB (API di DocumentDB)
  Archivio Data Lake di Azure
  Database SQL di Azure
  Azure SQL Data Warehouse
  Indice di Ricerca di Azure
  Archivio tabelle di Azure
Database Amazon Redshift
  DB2*
  MySQL*
  Oracle*
  PostgreSQL*
  SAP Business Warehouse*
  SAP HANA*
  SQL Server*
  Sybase*
  Teradata*
NoSQL Cassandra*
  MongoDB*
File Amazon S3
  File system*
  FTP
  HDFS*
  SFTP
Altro HTTP generico
  OData generico
  ODBC generico*
  Salesforce
  Tabella Web (tabella da HTML)
  GE Historian*

Per informazioni dettagliate sui campi o sulle proprietà visualizzate durante la copia guidata di un archivio dati, fare clic sul collegamento relativo all'archivio dati nella tabella.