ナンブル
col1 が NaN でない場合は col1 を返し、col1 が NaN の場合は col2 を返します。両方の入力は浮動小数点列 (DoubleType または FloatType) である必要があります。Spark Connect をサポートします。
対応する Databricks SQL 関数については、 nanvl関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.nanvl(col1=<col1>, col2=<col2>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| チェックする最初の列。 |
|
| 最初の列が NaN の場合に返される 2 番目の列。 |
戻り値
pyspark.sql.Column: 最初の列の値、または最初の列が NaN の場合は 2 番目の列の値。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
Output
+---+---+-----------+-----------+
| a| b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN| 1.0| 1.0|
|NaN|2.0| 2.0| 2.0|
+---+---+-----------+-----------+