Pular para o conteúdo principal

min

Retorna o valor mínimo da expressão em um grupo.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.min(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

A coluna de destino na qual o valor mínimo é calculado.

Devoluções

pyspark.sql.ColumnUma coluna que contém o valor mínimo calculado.

Exemplos

Exemplo 1 : calcular o valor mínimo de uma coluna numérica

Python
import pyspark.sql.functions as sf
df = spark.range(10)
df.select(sf.min(df.id)).show()
Output
+-------+
|min(id)|
+-------+
| 0|
+-------+

Exemplo 2 : calcular o valor mínimo de uma coluna de strings

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([("Alice",), ("Bob",), ("Charlie",)], ["name"])
df.select(sf.min("name")).show()
Output
+---------+
|min(name)|
+---------+
| Alice|
+---------+

Exemplo 3 : calcular o valor mínimo de uma coluna com valores nulos.

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1,), (None,), (3,)], ["value"])
df.select(sf.min("value")).show()
Output
+----------+
|min(value)|
+----------+
| 1|
+----------+

Exemplo 4 : calcular o valor mínimo de uma coluna em um DataFrameagrupado

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([("Alice", 1), ("Alice", 2), ("Bob", 3)], ["name", "value"])
df.groupBy("name").agg(sf.min("value")).show()
Output
+-----+----------+
| name|min(value)|
+-----+----------+
|Alice| 1|
| Bob| 3|
+-----+----------+

Exemplo 5 : calcular o valor mínimo de uma coluna em um DataFrame com múltiplas colunas

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame(
[("Alice", 1, 100), ("Bob", 2, 200), ("Charlie", 3, 300)],
["name", "value1", "value2"])
df.select(sf.min("value1"), sf.min("value2")).show()
Output
+-----------+-----------+
|min(value1)|min(value2)|
+-----------+-----------+
| 1| 100|
+-----------+-----------+