modo

Retorna o valor mais frequente em um grupo.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.mode(col, deterministic=False)

Parâmetros

Parâmetro	Tipo	Descrição
`col`	`pyspark.sql.Column` ou nome da coluna	coluna de destino para compute .
`deterministic`	booleano, opcional	Se houver vários resultados com a mesma frequência, retorne o menor (o padrão é falso).

Parâmetro	Tipo	Descrição
`col`	`pyspark.sql.Column` ou nome da coluna	coluna de destino para compute .
`deterministic`	booleano, opcional	Se houver vários resultados com a mesma frequência, retorne o menor (o padrão é falso).

Devoluções

pyspark.sql.Column: o valor mais frequente em um grupo.

Exemplos

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([
    ("Java", 2012, 20000), ("dotNET", 2012, 5000),
    ("Java", 2012, 20000), ("dotNET", 2012, 5000),
    ("dotNET", 2013, 48000), ("Java", 2013, 30000)],
    schema=("course", "year", "earnings"))
df.groupby("course").agg(sf.mode("year")).sort("course").show()

Output
+------+----------+
|course|mode(year)|
+------+----------+
|  Java|      2012|
|dotNET|      2012|
+------+----------+

Quando vários valores têm a mesma frequência máxima, qualquer um dos valores é retornado se `deterministic` for falso ou não estiver definido, ou o menor valor é retornado se `terministic` for verdadeiro.

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([(-10,), (0,), (10,)], ["col"])
df.select(sf.mode("col", True)).show()

Output
+---------------------------------------+
|mode() WITHIN GROUP (ORDER BY col DESC)|
+---------------------------------------+
|                                    -10|
+---------------------------------------+

Sintaxe​

Parâmetros​

Devoluções​

Exemplos​

Sintaxe

Parâmetros

Devoluções

Exemplos