メインコンテンツまでスキップ

Databricksを用いたParquetファイルの読み込み

この記事では、Databricks を使用して Apache Parquet ファイルからデータを読み取る方法について説明します。

Parquetとは?

Apache Parquet は、クエリを高速化する最適化を備えた列指向ファイル形式です。これは、CSVJSON よりも効率的なファイル形式です。

詳細については、「 Parquet ファイル」を参照してください。

オプション

DataFrameReaderDataFrameWriter.option()メソッドと.options()メソッドを使用して、 Parquetデータ ソースを構成します。 サポートされているオプションの完全なリストについては、 DataFrameReader Parquet オプションDataFrameWriter Parquet オプションを参照してください。

ノートブックの例: Parquet ファイルの読み取りと書き込み

次のノートブックは、Parquet ファイルに対してデータを読み書きする方法を示しています。

Parquetファイルノートブックの読み取り

ノートブックを新しいタブで開く