Formati di dati supportati da Azure Synapse Esplora dati per l'inserimento (anteprima)
L'inserimento dati è il processo in base al quale i dati vengono aggiunti a una tabella e vengono resi disponibili per la query in Esplora dati. Per tutti i metodi di inserimento, diversi da ingest-from-query, i dati devono trovarsi in uno dei formati supportati. Nella tabella seguente sono elencati e descritti i formati supportati Esplora dati per l'inserimento dati.
Nota
Prima di inserire i dati, assicurarsi che i dati siano formattati correttamente e definissi i campi previsti. È consigliabile usare il validator preferito per verificare che il formato sia valido. Ad esempio, è possibile trovare i validator seguenti utili per controllare i file CSV o JSON:
- CSV: http://csvlint.io/
- JSON: https://jsonlint.com/
Per altre informazioni sul motivo per cui l'inserimento potrebbe non riuscire, vedere Errori di inserimento e codici di errore di inserimento in Esplora dati.
Formattazione | Estensione | Descrizione |
---|---|---|
ApacheAvro | .avro |
Formato AVRO con supporto per i tipi logici. Sono supportati i codec di compressione seguenti: null , deflate e snappy . L'implementazione del apacheavro formato del lettore è basata sulla libreria ufficiale di Apache Avro. |
Avro | .avro |
Implementazione legacy per il formato AVRO basato sulla libreria .NET. Sono supportati i codec di compressione seguenti: null , deflate (per snappy - usare il ApacheAvro formato dati). |
CSV | .csv |
File di testo con valori delimitati da virgole (, ). Vedere RFC 4180: Common Format e MIME Type for Comma-Separated Values (CSV) Files (RFC 4180: Common Format and MIME Type for Comma-Separated Values). |
JSON | .json |
Un file di testo con oggetti JSON delimitati da \n o \r\n . Vedere Righe JSON (JSONL). |
MultiJSON | .multijson |
File di testo con una matrice JSON di contenitori di proprietà (ognuno dei quali rappresenta un record) o un numero qualsiasi di contenitori di proprietà delimitati da spazi vuoti, \n o \r\n . Ogni contenitore di proprietà può essere distribuito su più righe. Questo formato è preferibile rispetto JSON a , a meno che i dati non siano contenitori di proprietà. |
ORC | .orc |
Un file ORC. |
Parquet | .parquet |
Un file Parquet. |
PSV | .psv |
File di testo con valori delimitati da barre verticali (| ). |
RAW | .raw |
File di testo il cui intero contenuto è un singolo valore stringa. |
SCsv | .scsv |
File di testo con valori delimitati da punti e virgola (; ). |
SOHsv | .sohsv |
File di testo con valori delimitati da SOH. SOH è il punto di codice ASCII 1. Questo formato è usato da Hive in HDInsight. |
TSV | .tsv |
File di testo con valori delimitati da tabulazioni (\t ). |
TSVE | .tsv |
File di testo con valori delimitati da tabulazioni (\t ). Per l'escape viene usato un carattere barra rovesciata (\ ). |
TXT | .txt |
File di testo con righe delimitate da \n . Le righe vuote vengono ignorate. |
W3CLOGFILE | .log |
Formato di file di log Web standardizzato da W3C. |
Formati di compressione dei dati supportati
I BLOB e i file possono essere compressi tramite uno degli algoritmi di compressione seguenti:
Compressione | Estensione |
---|---|
GZip | gz |
CAP | .zip |
Indicare la compressione aggiungendo l'estensione al nome del BLOB o del file.
Ad esempio:
MyData.csv.zip
indica un BLOB o un file formattato come CSV, compresso con ZIP (archivio o singolo file)MyData.json.gz
indica un BLOB o un file formattato come JSON, compresso con GZip.
Sono supportati anche nomi di BLOB o file che non includono le estensioni di formato, ma solo la compressione ( ad esempio , MyData.zip
). In questo caso, il formato di file deve essere specificato come proprietà di inserimento perché non può essere dedotto.
Nota
- Alcuni formati di compressione tengono traccia dell'estensione di file originale come parte del flusso compresso. Questa estensione viene generalmente ignorata ai fini della determinazione del formato di file. Se non è possibile determinare il formato di file dal nome del file o del BLOB (compresso), deve essere specificato tramite la proprietà di inserimento
format
. - Non confondersi con il codec di compressione interno (livello di blocco) usato dai
Parquet
formati eAVRO
ORC
. Il nome di compressione interno viene in genere aggiunto a un nome di file prima dell'estensione del formato di file, ad esempio ,file1.gz.parquet
file1.snappy.avro
e così via.
Passaggi successivi
- Altre informazioni sull'inserimento dati
- Altre informazioni sulle proprietà di inserimento dati