Elaborare file di testo a lunghezza fissa usando flussi di dati di mapping di Data Factory

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi completa per le aziende. Microsoft Fabric copre tutti gli elementi, dallo spostamento dei dati all'analisi scientifica dei dati, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Scopri come avviare gratuitamente una nuova versione di valutazione .

Usando i flussi di dati di mapping in Microsoft Azure Data Factory, è possibile trasformare i dati da file di testo a larghezza fissa. Nell'attività seguente si definirà un set di dati per un file di testo senza un delimitatore e quindi si configureranno divisioni di sottostringa in base alla posizione ordinale.

Creare una pipeline

  1. Selezionare +Nuova pipeline per creare una nuova pipeline.

  2. Aggiungere un'attività del flusso di dati che verrà usata per l'elaborazione di file a larghezza fissa:

    Fixed Width Pipeline

  3. Nell'attività flusso di dati selezionare Nuovo flusso di dati di mapping.

  4. Aggiungere una trasformazione Origine, Colonna derivata, Seleziona e Sink:

    Fixed Width Data Flow

  5. Configurare la trasformazione Origine per l'uso di un nuovo set di dati, che sarà di tipo Testo delimitato.

  6. Non impostare alcun delimitatore o intestazione di colonna.

    A questo punto verranno impostati i punti iniziali e le lunghezze dei campi per il contenuto di questo file:

    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    
  7. Nella scheda Proiezione della trasformazione Origine dovrebbe essere visualizzata una colonna stringa denominata Column_1.

  8. Nella colonna Derivata creare una nuova colonna.

  9. Verranno specificati i nomi semplici delle colonne, ad esempio col1.

  10. Nel generatore di espressioni digitare quanto segue:

    substring(Column_1,1,4)

    derived column

  11. Ripetere il passaggio 10 per tutte le colonne da analizzare.

  12. Selezionare la scheda Inspect (Ispeziona) per visualizzare le nuove colonne che verranno generate:

    inspect

  13. Usare la trasformazione Select per rimuovere una delle colonne che non sono necessarie per la trasformazione:

    select transformation

  14. Usare Sink per restituire i dati in una cartella:

    fixed width sink

    L'output è il seguente:

    fixed width output

I dati a larghezza fissa sono ora suddivisi, con quattro caratteri ciascuno e assegnati a Col1, Col2, Col3, Col4 e così via. In base all'esempio precedente, i dati vengono suddivisi in quattro colonne.