Pular para o conteúdo principal

significar

Retorna a média dos valores em um grupo. Um alias de avg.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.mean(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

coluna de destino para compute .

Devoluções

pyspark.sql.Column: a coluna para resultados de cálculo.

Exemplos

Exemplo 1 : Calculando a idade média

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.mean("age")).show()
Output
+--------+
|avg(age)|
+--------+
| 8.5|
+--------+

Exemplo 2 : Calculando a idade média sem nenhum valor definido.

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.mean("age")).show()
Output
+--------+
|avg(age)|
+--------+
| 3.0|
+--------+