メインコンテンツまでスキップ

covar_samp

col1 と col2 のサンプル共分散の新しい列を返します。

構文

Python
from pyspark.sql import functions as sf

sf.covar_samp(col1, col2)

パラメーター

パラメーター

Type

説明

col1

pyspark.sql.Column または列名

共分散を計算する最初の列。

col2

pyspark.sql.Column または列名

共分散を計算する 2 番目の列。

戻り値

pyspark.sql.Column: これら 2 つの列の値のサンプル共分散。

Python
from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_samp("a", df.b)).show()
Output
+----------------+
|covar_samp(a, b)|
+----------------+
| 0.0|
+----------------+