Чтение файлов Parquet с помощью Azure Databricks

В этой статье показано, как считывать данные из файлов Apache Parquet с помощью Azure Databricks.

Что такое Parquet?

Apache Parquet — это формат столбцов с оптимизацией, которая ускоряет запросы. Это более эффективный формат файла, чем CSV или JSON.

Дополнительные сведения см. в разделе "Файлы Parquet".

Параметры

Поддерживаемые параметры чтения и записи см. в следующих справочных статьях об Apache Spark.

Пример записной книжки: чтение и запись в файлы Parquet

В следующей записной книжке показано, как считывать и записывать данные в файлы Parquet.

Чтение записной книжки файлов Parquet

Получить записную книжку