agg (DataFrame)
Agregar em todo o DataFrame sem grupos (abreviação de df.groupBy().agg()).
Sintaxe
agg(*exprs: Union[Column, Dict[str, str]])
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| Coluna ou dicionário de stringsde key e valor | Colunas ou expressões pelas quais o DataFrame deve ser agregado. |
Devoluções
DataFrame: DataFrame agregado.
Exemplos
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.agg({"age": "max"}).show()
# +--------+
# |max(age)|
# +--------+
# | 5|
# +--------+
df.agg(sf.min(df.age)).show()
# +--------+
# |min(age)|
# +--------+
# | 2|
# +--------+