Pular para o conteúdo principal

tente_média

Retorna a média calculada a partir dos valores de um grupo e o resultado é nulo em caso de estouro de capacidade.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.try_avg(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

coluna de destino para compute .

Exemplos

Exemplo 1 : Calculando a idade média

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.try_avg("age")).show()
Output
+------------+
|try_avg(age)|
+------------+
| 8.5|
+------------+

Exemplo 2 : Calculando a idade média sem nenhum valor definido.

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.try_avg("age")).show()
Output
+------------+
|try_avg(age)|
+------------+
| 3.0|
+------------+