Pular para o conteúdo principal

covar_samp

Retorna uma nova coluna para a covariância amostral de col1 e col2.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.covar_samp(col1, col2)

Parâmetros

Parâmetro

Tipo

Descrição

col1

pyspark.sql.Column ou nome da coluna

Primeira coluna para calcular a covariância.

col2

pyspark.sql.Column ou nome da coluna

Segunda coluna para calcular a covariância.

Devoluções

pyspark.sql.Column: covariância amostral dos valores dessas duas colunas.

Exemplos

Python
from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_samp("a", df.b)).show()
Output
+----------------+
|covar_samp(a, b)|
+----------------+
| 0.0|
+----------------+