nanvl
Retorna col1 se não for NaN, ou col2 se col1 for NaN. Ambas as entradas devem ser colunas de ponto flutuante (DoubleType ou FloatType). Compatível com Spark Connect.
Para a função Databricks SQL correspondente, consulte a funçãonanvl.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.nanvl(col1=<col1>, col2=<col2>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Primeira coluna a verificar. |
|
| Segunda coluna a ser retornada se a primeira for NaN. |
Devoluções
pyspark.sql.Column: valor da primeira coluna ou da segunda se a primeira for NaN.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
Output
+---+---+-----------+-----------+
| a| b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN| 1.0| 1.0|
|NaN|2.0| 2.0| 2.0|
+---+---+-----------+-----------+