Inserire dati in Azure Data Lake Storage Gen2

Articolo
06/15/2023

Questo articolo illustra come inserire dati da una posizione a un'altra in un account di archiviazione Azure Data Lake Gen 2 (Azure Data Lake Gen 2) con Azure Synapse Analytics.

Prerequisiti

Sottoscrizione di Azure: se non si ha una sottoscrizione di Azure, creare un account Azure gratuito prima di iniziare.
Account di archiviazione di Azure: usare Azure Data Lake Gen 2 come archivio dati di origine. Se non si ha un account di archiviazione, vedere Creare un account di archiviazione di Azure per informazioni su come crearne uno.

Creare servizi collegati

In Azure Synapse Analytics si usano i servizi collegati per definire le informazioni di connessione ad altri servizi. In questa sezione Azure Synapse Analytics e Azure Data Lake Gen 2 verranno aggiunti come servizi collegati.

Aprire l'interfaccia utente di Azure Synapse Analytics e passare alla scheda Gestisci.
In Connessioni esterne selezionare Servizi collegati.
Per aggiungere un servizio collegato, selezionare Nuovo.
Selezionare il riquadro Azure Data Lake Storage Gen2 nell'elenco e selezionare Continua.
Immettere le credenziali di autenticazione. I tipi di autenticazione attualmente supportati sono la chiave dell'account, l'entità servizio e l'identità gestita. Selezionare Test connessione per verificare che le credenziali siano corrette.
Selezionare Create (Crea) al termine.

Creare una pipeline

Una pipeline contiene il flusso logico per un'esecuzione di un set di attività. In questa sezione si creerà una pipeline contenente un'attività di copia che inserisce i dati da Azure Data Lake Gen 2 in un pool SQL dedicato.

Passare alla scheda Orchestrate (Orchestrate ). Selezionare l'icona con il segno più accanto all'intestazione pipeline e selezionare Pipeline.
In Move and Transform (Sposta e trasforma) nel riquadro delle attività trascinare Copia dati sul canvas della pipeline.
Selezionare l'attività di copia e passare alla scheda Origine . Selezionare Nuovo per creare un nuovo set di dati di origine.
Selezionare Azure Data Lake Storage Gen2 come archivio dati e selezionare Continua.
Selezionare DelimitedText come formato e selezionare Continua.
Nel riquadro di impostazione delle proprietà selezionare il servizio collegato Azure Data Lake Storage creato. Specificare il percorso del file dei dati di origine e indicare se la prima riga contiene un'intestazione. È possibile importare lo schema dall'archivio file o da un file di esempio. Selezionare OK al termine.
Passare alla scheda Sink . Selezionare Nuovo per creare un nuovo set di dati sink.
Selezionare Azure Data Lake Storage gen2 come archivio dati e selezionare Continua.
Selezionare DelimitedText come formato e selezionare Continua.
Nel riquadro di impostazione delle proprietà selezionare il servizio collegato Azure Data Lake Storage creato. Specificare il percorso della cartella in cui scrivere i dati. Selezionare OK al termine.

Eseguire il debug della pipeline e pubblicarla

Dopo aver completato la configurazione della pipeline, è possibile eseguire il debug prima di pubblicare gli artefatti per verificare che tutto sia corretto.

Per eseguire il debug della pipeline, selezionare Debug sulla barra degli strumenti. Lo stato dell'esecuzione della pipeline verrà visualizzato nella scheda Output nella parte inferiore della finestra.
Quando è possibile eseguire correttamente la pipeline, nella barra degli strumenti superiore selezionare Pubblica tutto. Questa azione pubblica le entità create (set di dati e pipeline) create nel servizio Synapse Analytics.
Attendere fino alla visualizzazione del messaggio Pubblicazione riuscita. Per visualizzare i messaggi di notifica, selezionare il pulsante a forma di campana in alto a destra.

Attivare e monitorare la pipeline

In questo passaggio si attiverà manualmente la pipeline pubblicata nel passaggio precedente.

Selezionare Aggiungi trigger nella barra degli strumenti, quindi selezionare Attiva adesso. Nella pagina Pipeline Run (Esecuzione di pipeline) selezionare Fine.
Passare alla scheda Monitora nella barra laterale sinistra. Viene visualizzata un'esecuzione della pipeline attivata da un trigger manuale. È possibile usare i collegamenti nella colonna Azioni per visualizzare i dettagli delle attività ed eseguire di nuovo la pipeline.
Per visualizzare le esecuzioni di attività associate all'esecuzione della pipeline, selezionare il collegamento View Activity Runs (Visualizza le esecuzioni di attività) nella colonna Azioni. In questo esempio è presente una sola attività, quindi nell'elenco viene visualizzata una sola voce. Per informazioni dettagliate sull'operazione di copia, selezionare il collegamento Dettagli (icona a forma di occhiali) nella colonna Azioni. Selezionare Pipeline Runs (Esecuzioni di pipeline) in alto per tornare alla visualizzazione delle esecuzioni. Per aggiornare la visualizzazione, selezionare Aggiorna.
Verificare che i dati siano scritti correttamente nel pool SQL dedicato.

Passaggi successivi

Per altre informazioni sull'integrazione dei dati per Azure Synapse Analytics, vedere l'articolo Inserimento di dati in un pool SQL dedicato.