covar_pop
Retorna uma nova coluna para a covariância populacional de col1 e col2.
Sintaxe
Python
from pyspark.sql import functions as sf
sf.covar_pop(col1, col2)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Primeira coluna para calcular a covariância. |
|
| Segunda coluna para calcular a covariância. |
Devoluções
pyspark.sql.Column: covariância dos valores dessas duas colunas.
Exemplos
Python
from pyspark.sql import functions as sf
a = [1] * 10
b = [1] * 10
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.covar_pop("a", df.b)).show()
Output
+---------------+
|covar_pop(a, b)|
+---------------+
| 0.0|
+---------------+