メインコンテンツまでスキップ

矢印へ

この DataFrame の内容を PyArrow pyarrow.Tableとして返します。

Databricks Runtime 15.3で追加されました

構文

toArrow()

戻り値

pyarrow.Table

注意

この方法は、結果として得られる PyArrow pyarrow.Tableが小さいと予想される場合にのみ使用してください。これは、すべてのデータがドライバのメモリにロードされるためです。

これは、PyArrowがインストールされ、利用可能な場合にのみ利用できます。

このAPIは開発者向けAPIです。

Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]
このページの見出し