Parquet-bestanden lezen met Azure Databricks

Artikel
03/01/2024

In dit artikel leest u hoe u gegevens leest uit Apache Parquet-bestanden met behulp van Azure Databricks.

Wat is Parquet?

Apache Parquet is een kolombestandsindeling met optimalisaties waarmee query's sneller worden uitgevoerd. Het is een efficiëntere bestandsindeling dan CSV of JSON.

Zie Parquet-bestanden voor meer informatie.

Opties

Zie de volgende Apache Spark-referentieartikelen voor ondersteunde lees- en schrijfopties.

Lezen
- Python
- Scala
Schrijven
- Python
- Scala

Voorbeeld van notitieblok: Lezen en schrijven naar Parquet-bestanden

In het volgende notebook ziet u hoe u gegevens kunt lezen en schrijven naar Parquet-bestanden.

Parquet-bestandennotitieblok lezen

Notebook downloaden

Parquet-bestanden lezen met Azure Databricks

Wat is Parquet?

Opties

Voorbeeld van notitieblok: Lezen en schrijven naar Parquet-bestanden

Parquet-bestandennotitieblok lezen

Aanvullende resources