次の方法で共有


Azure Databricks を使用して Parquet ファイルを読み取る

この記事では、Azure Databricks を使用して Apache Parquet ファイルからデータを読み取る方法について説明します。

Parquet とは

Apache Parquet は、クエリを最適化して高速化する、列指向ファイル形式です。 CSVJSON よりも効率的なファイル形式です。

詳細については、Parquet ファイルに関するページを参照してください。

オプション

サポートされる読み取りと書き込みのオプションについては、次の Apache Spark 関連記事を参照してください。

ノートブックの例: Parquet ファイルの読み取りと書き込み

次のノートブックは、Parquet ファイルとの間でデータを読み書きする方法を示しています。

Parquet ファイルの読み取りノートブック

ノートブックを入手