Parquet-bestanden lezen met Azure Databricks

In dit artikel leest u hoe u gegevens leest uit Apache Parquet-bestanden met behulp van Azure Databricks.

Wat is Parquet?

Apache Parquet is een kolombestandsindeling met optimalisaties waarmee query's sneller worden uitgevoerd. Het is een efficiƫntere bestandsindeling dan CSV of JSON.

Zie Parquet-bestanden voor meer informatie.

Opties

Zie de volgende Apache Spark-referentieartikelen voor ondersteunde lees- en schrijfopties.

Voorbeeld van notitieblok: Lezen en schrijven naar Parquet-bestanden

In het volgende notebook ziet u hoe u gegevens kunt lezen en schrijven naar Parquet-bestanden.

Parquet-bestandennotitieblok lezen

Notebook downloaden