Databricksを用いたParquetファイルの読み込み
この記事では、Databricks を使用して Apache Parquet ファイルからデータを読み取る方法について説明します。
Parquetとは?
Apache Parquet は、クエリを高速化する最適化を備えた列指向ファイル形式です。これは、CSV や JSON よりも効率的なファイル形式です。
詳細については、「 Parquet ファイル」を参照してください。
オプション
DataFrameReaderとDataFrameWriterの.option()メソッドと.options()メソッドを使用して、 Parquetデータ ソースを構成します。 サポートされているオプションの完全なリストについては、 DataFrameReader Parquet オプションとDataFrameWriter Parquet オプションを参照してください。
ノートブックの例: Parquet ファイルの読み取りと書き込み
次のノートブックは、Parquet ファイルに対してデータを読み書きする方法を示しています。