Pular para o conteúdo principal

qualquer_valor

Retorna algum valor de col para um grupo de linhas.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.any_value(col, ignoreNulls=None)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

coluna de destino para trabalhar.

ignoreNulls

pyspark.sql.Column ou booleano, opcional

Se o primeiro valor for nulo, procure o primeiro valor não nulo.

Devoluções

pyspark.sql.Column: algum valor de col para um grupo de linhas.

Exemplos

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.select(sf.any_value('c1'), sf.any_value('c2')).show()
Output
+-------------+-------------+
|any_value(c1)|any_value(c2)|
+-------------+-------------+
| NULL| 1|
+-------------+-------------+
Python
df.select(sf.any_value('c1', True), sf.any_value('c2', True)).show()
Output
+-------------+-------------+
|any_value(c1)|any_value(c2)|
+-------------+-------------+
| a| 1|
+-------------+-------------+