covar_samp
col1 と col2 のサンプル共分散の新しい列を返します。
構文
Python
from pyspark.sql import functions as sf
sf.covar_samp(col1, col2)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 共分散を計算する最初の列。 |
|
| 共分散を計算する 2 番目の列。 |
戻り値
pyspark.sql.Column: これら 2 つの列の値のサンプル共分散。
例
Python
from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_samp("a", df.b)).show()
Output
+----------------+
|covar_samp(a, b)|
+----------------+
| 0.0|
+----------------+