pandas_api

既存のDataFrameをpandas-on-Spark DataFrameに変換します。

構文

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

パラメーター

パラメーター	Type	説明
`index_col`	文字列または文字列のリスト（省略可能）	Sparkにおけるテーブルのインデックス列。

戻り値

PandasOnSparkDataFrame

注意

pandas-on-Spark DataFrameをSpark DataFrameに変換し、その後再びpandas-on-Sparkに戻すと、インデックス情報が失われ、元のインデックスが通常の列に変換されます。

これは、Pandasがインストールされ、利用可能な場合にのみ利用できます。

例

Python
df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob

構文​

パラメーター​

戻り値​

注意​

例​

構文

パラメーター

戻り値

注意

例