メインコンテンツまでスキップ

統計

統計関数に対してはDataFrameStatFunctionsを返します。

戻り値

DataFrameStatFunctions

Python
import pyspark.sql.functions as f
df = spark.range(3).withColumn("c", f.expr("id + 1"))
type(df.stat)
# <class '...dataframe.DataFrameStatFunctions'>
df.stat.corr("id", "c")
# 1.0
このページの見出し