agg( DataFrame )
グループを使用せずにDataFrame全体で集計します ( df.groupBy().agg()の短縮形)。
構文
agg(*exprs: Union[Column, Dict[str, str]])
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| キーと値の文字列からなる列または辞書 | DataFrameを集計する対象となる列または式。 |
戻り値
DataFrame: 集計DataFrame 。
例
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.agg({"age": "max"}).show()
# +--------+
# |max(age)|
# +--------+
# | 5|
# +--------+
df.agg(sf.min(df.age)).show()
# +--------+
# |min(age)|
# +--------+
# | 2|
# +--------+