Pular para o conteúdo principal

média

Retorna a média dos valores em um grupo.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.avg(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

coluna de destino para compute .

Devoluções

pyspark.sql.Column: a coluna para resultados de cálculo.

Exemplos

Exemplo 1 : Calculando a idade média

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.avg("age")).show()
Output
+--------+
|avg(age)|
+--------+
| 8.5|
+--------+

Exemplo 2 : Calculando a idade média sem nenhum valor definido.

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.avg("age")).show()
Output
+--------+
|avg(age)|
+--------+
| 3.0|
+--------+