メインコンテンツまでスキップ

corr( DataFrame )

DataFrameの2つの列間の相関をdouble型の値として計算します。現在はピアソン相関係数のみをサポートしています。DataFrame.corrDataFrameStatFunctions.corrは互いの別名です。

構文

corr(col1: str, col2: str, method: Optional[str] = None)

パラメーター

パラメーター

Type

説明

col1

str

最初の列の名前。

col2

str

2列目の名前。

method

文字列、オプション

相関分析法。現在サポートされているのは「ピアソン」のみです。

戻り値

float: 2つの列間のピアソン相関係数。

Python
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0
このページの見出し