メインコンテンツまでスキップ

agg( DataFrame )

グループを使用せずにDataFrame全体で集計します ( df.groupBy().agg()の短縮形)。

構文

agg(*exprs: Union[Column, Dict[str, str]])

パラメーター

パラメーター

Type

説明

exprs

キーと値の文字列からなる列または辞書

DataFrameを集計する対象となる列または式。

戻り値

DataFrame: 集計DataFrame 。

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.agg({"age": "max"}).show()
# +--------+
# |max(age)|
# +--------+
# | 5|
# +--------+
df.agg(sf.min(df.age)).show()
# +--------+
# |min(age)|
# +--------+
# | 2|
# +--------+
このページの見出し