Formati di dati supportati da Azure Synapse Esplora dati per l'inserimento (anteprima)

Articolo
10/18/2023

L'inserimento dati è il processo in base al quale i dati vengono aggiunti a una tabella e vengono resi disponibili per la query in Esplora dati. Per tutti i metodi di inserimento, diversi da ingest-from-query, i dati devono trovarsi in uno dei formati supportati. Nella tabella seguente sono elencati e descritti i formati supportati Esplora dati per l'inserimento dati.

Nota

Prima di inserire i dati, assicurarsi che i dati siano formattati correttamente e definissi i campi previsti. È consigliabile usare il validator preferito per verificare che il formato sia valido. Ad esempio, è possibile trovare i validator seguenti utili per controllare i file CSV o JSON:

CSV: http://csvlint.io/
JSON: https://jsonlint.com/

Per altre informazioni sul motivo per cui l'inserimento potrebbe non riuscire, vedere Errori di inserimento e codici di errore di inserimento in Esplora dati.

Formattazione	Estensione	Descrizione
ApacheAvro	`.avro`	Formato AVRO con supporto per i tipi logici. Sono supportati i codec di compressione seguenti: `null`, `deflate`e `snappy`. L'implementazione del `apacheavro` formato del lettore è basata sulla libreria ufficiale di Apache Avro.
Avro	`.avro`	Implementazione legacy per il formato AVRO basato sulla libreria .NET. Sono supportati i codec di compressione seguenti: `null`, `deflate` (per `snappy` - usare il `ApacheAvro` formato dati).
CSV	`.csv`	File di testo con valori delimitati da virgole (`,`). Vedere RFC 4180: Common Format e MIME Type for Comma-Separated Values (CSV) Files (RFC 4180: Common Format and MIME Type for Comma-Separated Values).
JSON	`.json`	Un file di testo con oggetti JSON delimitati da `\n` o `\r\n`. Vedere Righe JSON (JSONL).
MultiJSON	`.multijson`	File di testo con una matrice JSON di contenitori di proprietà (ognuno dei quali rappresenta un record) o un numero qualsiasi di contenitori di proprietà delimitati da spazi vuoti, `\n` o `\r\n`. Ogni contenitore di proprietà può essere distribuito su più righe. Questo formato è preferibile rispetto `JSON`a , a meno che i dati non siano contenitori di proprietà.
ORC	`.orc`	Un file ORC.
Parquet	`.parquet`	Un file Parquet.
PSV	`.psv`	File di testo con valori delimitati da barre verticali (`\|`).
RAW	`.raw`	File di testo il cui intero contenuto è un singolo valore stringa.
SCsv	`.scsv`	File di testo con valori delimitati da punti e virgola (`;`).
SOHsv	`.sohsv`	File di testo con valori delimitati da SOH. SOH è il punto di codice ASCII 1. Questo formato è usato da Hive in HDInsight.
TSV	`.tsv`	File di testo con valori delimitati da tabulazioni (`\t`).
TSVE	`.tsv`	File di testo con valori delimitati da tabulazioni (`\t`). Per l'escape viene usato un carattere barra rovesciata (`\`).
TXT	`.txt`	File di testo con righe delimitate da `\n`. Le righe vuote vengono ignorate.
W3CLOGFILE	`.log`	Formato di file di log Web standardizzato da W3C.

Formati di compressione dei dati supportati

I BLOB e i file possono essere compressi tramite uno degli algoritmi di compressione seguenti:

Compressione	Estensione
GZip	gz
CAP	.zip

Indicare la compressione aggiungendo l'estensione al nome del BLOB o del file.

Ad esempio:

MyData.csv.zip indica un BLOB o un file formattato come CSV, compresso con ZIP (archivio o singolo file)
MyData.json.gz indica un BLOB o un file formattato come JSON, compresso con GZip.

Sono supportati anche nomi di BLOB o file che non includono le estensioni di formato, ma solo la compressione ( ad esempio , MyData.zip). In questo caso, il formato di file deve essere specificato come proprietà di inserimento perché non può essere dedotto.

Nota

Alcuni formati di compressione tengono traccia dell'estensione di file originale come parte del flusso compresso. Questa estensione viene generalmente ignorata ai fini della determinazione del formato di file. Se non è possibile determinare il formato di file dal nome del file o del BLOB (compresso), deve essere specificato tramite la proprietà di inserimento format.
Non confondersi con il codec di compressione interno (livello di blocco) usato dai Parquetformati e AVROORC . Il nome di compressione interno viene in genere aggiunto a un nome di file prima dell'estensione del formato di file, ad esempio , file1.gz.parquetfile1.snappy.avroe così via.

Passaggi successivi

Altre informazioni sull'inserimento dati
Altre informazioni sulle proprietà di inserimento dati

Formati di dati supportati da Azure Synapse Esplora dati per l'inserimento (anteprima)

Formati di compressione dei dati supportati

Passaggi successivi

Risorse aggiuntive