corr (DataFrameStatFunctions)
DataFrameの 2 つの列の相関を double 値として計算します。現在はピアソン相関係数のみをサポートしています。DataFrame.corrとDataFrameStatFunctions.corrは互いの別名です。
構文
corr(col1, col2, method=None)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| str | 最初の列の名前。 |
| str | 2列目の名前。 |
| 文字列、オプション | 相関分析法。現在サポートされているのは |
戻り値
float
例
Python
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0