矢印へ
この DataFrame の内容を PyArrow pyarrow.Tableとして返します。
Databricks Runtime 15.3で追加されました
構文
toArrow()
戻り値
pyarrow.Table
注意
この方法は、結果として得られる PyArrow pyarrow.Tableが小さいと予想される場合にのみ使用してください。これは、すべてのデータがドライバのメモリにロードされるためです。
これは、PyArrowがインストールされ、利用可能な場合にのみ利用できます。
このAPIは開発者向けAPIです。
例
Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]