Formato testo delimitato in Azure Data FactoryDelimited text format in Azure Data Factory

Seguire questo articolo quando si desidera analizzare i file di testo delimitati o scrivere i dati in un formato di testo delimitato.Follow this article when you want to parse the delimited text files or write the data into delimited text format.

Il formato testo delimitato è supportato per i connettori seguenti : Amazon S3, BLOB di Azure, Azure Data Lake storage Gen1, Azure Data Lake storage Gen2, archiviazione file di Azure, file System, FTP, Google Cloud Storage, HDFS, httpe SFTP.Delimited text format is supported for the following connectors: Amazon S3, Azure Blob, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure File Storage, File System, FTP, Google Cloud Storage, HDFS, HTTP, and SFTP.

Proprietà del set di datiDataset properties

Per un elenco completo delle sezioni e delle proprietà disponibili per la definizione dei set di dati, vedere l'articolo Set di dati.For a full list of sections and properties available for defining datasets, see the Datasets article. Questa sezione presenta un elenco delle proprietà supportate dal set di dati di testo delimitato.This section provides a list of properties supported by the delimited text dataset.

ProprietàProperty DescriptionDescription ObbligatorioRequired
typetype La proprietà Type del set di dati deve essere impostata su DelimitedText.The type property of the dataset must be set to DelimitedText. Yes
posizionelocation Impostazioni del percorso dei file.Location settings of the file(s). Ogni connettore basato su file ha un tipo di percorso e proprietà supportate in location.Each file-based connector has its own location type and supported properties under location. Yes
columnDelimitercolumnDelimiter Carattere o caratteri utilizzati per separare le colonne in un file.The character(s) used to separate columns in a file. Attualmente, il delimitatore multicarattere è supportato solo per il mapping del flusso di dati ma non per l'attività di copia.Currently, multi-char delimiter is only supported for mapping data flow but not Copy activity.
Il valore predefinito è ,virgola , quando il delimitatore di colonna è definito come una stringa vuota, ovvero nessun delimitatore, l'intera riga viene considerata come una colonna singola.The default value is comma ,, When the column delimiter is defined as empty string which means no delimiter, the whole line is taken as a single column.
NoNo
rowDelimiterrowDelimiter Singolo carattere o "\r\n" usato per separare le righe in un file.The single character or "\r\n" used to separate rows in a file.
Il valore predefinito è uno dei seguenti valori in lettura: ["\r\n", ",", "\n"] e "\n" o "\r\n" in scrittura mediante mapping del flusso di dati e dell'attività di copia rispettivamente.The default value is any of the following values on read: ["\r\n", "\r", "\n"], and "\n" or “\r\n” on write by mapping data flow and Copy activity respectively.
Quando rowDelimiter è impostato su nessun delimitatore (stringa vuota), il columnDelimiter deve essere impostato come nessun delimitatore (stringa vuota), ovvero per trattare l'intero contenuto come valore singolo.When rowDelimiter is set to no delimiter (empty string), the columnDelimiter must be set as no delimiter (empty string) as well, which means to treat the entire content as a single value.
NoNo
quoteCharquoteChar Carattere singolo per citare i valori di colonna se contiene un delimitatore di colonna.The single character to quote column values if it contains column delimiter.
Il valore predefinito è virgolette doppie ".The default value is double quotes ".
Per il mapping del flusso di dati, quoteChar non può essere una stringa vuota.For mapping data flow, quoteChar cannot be an empty string.
Per l'attività di copia, quando quoteChar viene definito come stringa vuota, significa che non sono presenti virgolette e il valore della colonna non è racchiuso tra virgolette e escapeChar viene usato per eseguire l'escape del delimitatore di colonna e di se stesso.For Copy activity, when quoteChar is defined as empty string, it means there is no quote char and column value is not quoted, and escapeChar is used to escape the column delimiter and itself.
NoNo
escapeCharescapeChar Carattere singolo per l'escape delle virgolette all'interno di un valore racchiuso tra virgolette.The single character to escape quotes inside a quoted value.
Il valore predefinito è la barra rovesciata \ .The default value is backslash \.
Per il mapping del flusso di dati, escapeChar non può essere una stringa vuota.For mapping data flow, escapeChar cannot be an empty string.
Per l'attività di copia, quando escapeChar viene definito come una stringa vuota, è necessario impostare anche la quoteChar come stringa vuota, nel qual caso assicurarsi che tutti i valori di colonna non contengano delimitatori.For Copy activity, when escapeChar is defined as empty string, the quoteChar must be set as empty string as well, in which case make sure all column values don’t contain delimiters.
NoNo
firstRowAsHeaderfirstRowAsHeader Specifica se trattare o rendere la prima riga come riga di intestazione con i nomi delle colonne.Specifies whether to treat/make the first row as a header line with names of columns.
I valori consentiti sono true e false (impostazione predefinita).Allowed values are true and false (default).
NoNo
nullValuenullValue Specifica la rappresentazione di stringa del valore null.Specifies the string representation of null value.
Il valore predefinito è una stringa vuota.The default value is empty string.
NoNo
encodingNameencodingName Tipo di codifica utilizzato per leggere/scrivere file di test.The encoding type used to read/write test files.
I valori consentiti sono i seguenti: "UTF-8", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "Johab", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", " IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149" , "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", " WINDOWS-1252 "," WINDOWS-1253 "," WINDOWS-1254 "," WINDOWS-1255 "," WINDOWS-1256 "," WINDOWS-1257 "," WINDOWS-1258 ".Allowed values are as follows: "UTF-8", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", “UTF-7”, "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258”.
Nota il flusso di dati del mapping non supporta la codifica UTF-7.Note mapping data flow doesn’t support UTF-7 encoding.
NoNo
compressionCodeccompressionCodec Codec di compressione utilizzato per leggere/scrivere file di testo.The compression codec used to read/write text files.
I valori consentiti sono bzip2, gzip, deflate, ZipDeflate, Snappero LZ4.Allowed values are bzip2, gzip, deflate, ZipDeflate, snappy, or lz4. da usare quando si salva il file.to use when saving the file.
Nota Attualmente l'attività di copia non supporta "blocco" & "LZ4" e il flusso di dati di mapping non supporta "ZipDeflate".Note currently Copy activity doesn’t support "snappy" & "lz4", and mapping data flow doesn’t support "ZipDeflate".
Nota Quando si usa l'attività di copia per decomprimere i file ZipDeflate e scrivere nell'archivio dati sink basato su file, i file vengono estratti nella cartella: <path specified in dataset>/<folder named as source zip file>/.Note when using copy activity to decompress ZipDeflate file(s) and write to file-based sink data store, files will be extracted to the folder: <path specified in dataset>/<folder named as source zip file>/.
NoNo
compressionLevelcompressionLevel Rapporto di compressione.The compression ratio.
I valori consentiti sono ottimali o più veloci.Allowed values are Optimal or Fastest.
- più veloce: l'operazione di compressione deve essere completata il più rapidamente possibile, anche se il file risultante non è compresso in modo ottimale.- Fastest: The compression operation should complete as quickly as possible, even if the resulting file is not optimally compressed.
- ottimale: l'operazione di compressione deve essere compressa in modo ottimale, anche se il completamento dell'operazione richiede più tempo.- Optimal: The compression operation should be optimally compressed, even if the operation takes a longer time to complete. Per maggiori informazioni, vedere l'argomento relativo al livello di compressione .For more information, see Compression Level topic.
NoNo

Di seguito è riportato un esempio di set di dati di testo delimitato nell'archivio BLOB di Azure:Below is an example of delimited text dataset on Azure Blob Storage:

{
    "name": "DelimitedTextDataset",
    "properties": {
        "type": "DelimitedText",
        "linkedServiceName": {
            "referenceName": "<Azure Blob Storage linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, retrievable during authoring > ],
        "typeProperties": {
            "location": {
                "type": "AzureBlobStorageLocation",
                "container": "containername",
                "folderPath": "folder/subfolder",
            },
            "columnDelimiter": ",",
            "quoteChar": "\"",
            "firstRowAsHeader": true,
            "compressionCodec": "gzip"
        }
    }
}

Proprietà dell'attività di copiaCopy activity properties

Per un elenco completo delle sezioni e delle proprietà disponibili per la definizione delle attività, vedere l'articolo sulle pipeline.For a full list of sections and properties available for defining activities, see the Pipelines article. Questa sezione presenta un elenco delle proprietà supportate dall'origine e dal sink di testo delimitati.This section provides a list of properties supported by the delimited text source and sink.

Testo delimitato come origineDelimited text as source

Le proprietà seguenti sono supportate nella sezione *origine* dell'attività di copia.The following properties are supported in the copy activity *source* section.

ProprietàProperty DescriptionDescription ObbligatorioRequired
typetype La proprietà Type dell'origine dell'attività di copia deve essere impostata su DelimitedTextSource.The type property of the copy activity source must be set to DelimitedTextSource. Yes
formatSettingsformatSettings Gruppo di proprietà.A group of properties. Vedere la tabella delle impostazioni di lettura testo delimitate .Refer to Delimited text read settings table below. NoNo
storeSettingsstoreSettings Un gruppo di proprietà su come leggere i dati da un archivio dati.A group of properties on how to read data from a data store. Ogni connettore basato su file ha le proprie impostazioni di lettura supportate in storeSettings.Each file-based connector has its own supported read settings under storeSettings. NoNo

Impostazioni di lettura testo delimitato supportate in formatSettings:Supported delimited text read settings under formatSettings:

ProprietàProperty DescriptionDescription ObbligatorioRequired
typetype Il tipo di formatSettings deve essere impostato su DelimitedTextReadSettings.The type of formatSettings must be set to DelimitedTextReadSettings. Yes
skipLineCountskipLineCount Indica il numero di righe non vuote da ignorare durante la lettura di dati da file di input.Indicates the number of non-empty rows to skip when reading data from input files.
Se vengono specificati sia skipLineCount che firstRowAsHeader, le righe vengono ignorate e quindi le informazioni dell'intestazione vengono lette dal file di input.If both skipLineCount and firstRowAsHeader are specified, the lines are skipped first and then the header information is read from the input file.
NoNo

Testo delimitato come sinkDelimited text as sink

Le proprietà seguenti sono supportate nella sezione *sink* dell'attività di copia.The following properties are supported in the copy activity *sink* section.

ProprietàProperty DescriptionDescription ObbligatorioRequired
typetype La proprietà Type dell'origine dell'attività di copia deve essere impostata su DelimitedTextSink.The type property of the copy activity source must be set to DelimitedTextSink. Yes
formatSettingsformatSettings Gruppo di proprietà.A group of properties. Vedere la tabella delle impostazioni di scrittura testo delimitate .Refer to Delimited text write settings table below.
storeSettingsstoreSettings Gruppo di proprietà su come scrivere dati in un archivio dati.A group of properties on how to write data to a data store. Ogni connettore basato su file ha le proprie impostazioni di scrittura supportate in storeSettings.Each file-based connector has its own supported write settings under storeSettings. NoNo

Impostazioni di scrittura testo delimitate supportate in formatSettings:Supported delimited text write settings under formatSettings:

ProprietàProperty DescriptionDescription ObbligatorioRequired
typetype Il tipo di formatSettings deve essere impostato su DelimitedTextWriteSettings.The type of formatSettings must be set to DelimitedTextWriteSettings. Yes
fileExtensionfileExtension Estensione di file utilizzata per assegnare un nome ai file di output, ad esempio .csv``.txt.The file extension used to name the output files, e.g. .csv, .txt. Deve essere specificato quando il fileName non è specificato nel set di dati DelimitedText di output.It must be specified when the fileName is not specified in the output DelimitedText dataset. Quando il nome del file viene configurato nel set di dati di output, verrà usato come nome del file di sink e l'impostazione dell'estensione di file verrà ignorata.When file name is configured in the output dataset, it will be used as the sink file name and the file extension setting will be ignored. Sì quando il nome file non è specificato nel set di dati di outputYes when file name is not specified in output dataset

Mapping delle proprietà del flusso di datiMapping data flow properties

Per informazioni dettagliate, vedere trasformazione origine e trasformazione sink nel flusso di dati del mapping.Learn details from source transformation and sink transformation in mapping data flow.

Passaggi successiviNext steps