agrupamento
Função de agregação: indica se uma coluna especificada em uma lista GROUP BY está agregada ou não, retornando 1 para agregada ou 0 para não agregada no conjunto de resultados.
Sintaxe
Python
from pyspark.sql import functions as sf
sf.grouping(col)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Coluna para verificar se está agregada. |
Devoluções
pyspark.sql.Column: retorna 1 para agregados ou 0 para não agregados no conjunto de resultados.
Exemplos
Exemplo 1 : Verificar status de agrupamento em operações de cubo
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], ("name", "age"))
df.cube("name").agg(sf.grouping("name"), sf.sum("age")).orderBy("name").show()
Output
+-----+--------------+--------+
| name|grouping(name)|sum(age)|
+-----+--------------+--------+
| NULL| 1| 7|
|Alice| 0| 2|
| Bob| 0| 5|
+-----+--------------+--------+