Pular para o conteúdo principal

agrupamento

Função de agregação: indica se uma coluna especificada em uma lista GROUP BY está agregada ou não, retornando 1 para agregada ou 0 para não agregada no conjunto de resultados.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.grouping(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou str

Coluna para verificar se está agregada.

Devoluções

pyspark.sql.Column: retorna 1 para agregados ou 0 para não agregados no conjunto de resultados.

Exemplos

Exemplo 1 : Verificar status de agrupamento em operações de cubo

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], ("name", "age"))
df.cube("name").agg(sf.grouping("name"), sf.sum("age")).orderBy("name").show()
Output
+-----+--------------+--------+
| name|grouping(name)|sum(age)|
+-----+--------------+--------+
| NULL| 1| 7|
|Alice| 0| 2|
| Bob| 0| 5|
+-----+--------------+--------+