メインコンテンツまでスキップ

ナンブル

col1 が NaN でない場合は col1 を返し、col1 が NaN の場合は col2 を返します。両方の入力は浮動小数点列 (DoubleType または FloatType) である必要があります。Spark Connect をサポートします。

対応する Databricks SQL 関数については、 nanvl関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.nanvl(col1=<col1>, col2=<col2>)

パラメーター

パラメーター

Type

説明

col1

pyspark.sql.Column または str

チェックする最初の列。

col2

pyspark.sql.Column または str

最初の列が NaN の場合に返される 2 番目の列。

戻り値

pyspark.sql.Column: 最初の列の値、または最初の列が NaN の場合は 2 番目の列の値。

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(1.0, float('nan')), (float('nan'), 2.0)], ("a", "b"))
df.select("*", dbf.nanvl("a", "b"), dbf.nanvl(df.a, df.b)).show()
Output
+---+---+-----------+-----------+
| a| b|nanvl(a, b)|nanvl(a, b)|
+---+---+-----------+-----------+
|1.0|NaN| 1.0| 1.0|
|NaN|2.0| 2.0| 2.0|
+---+---+-----------+-----------+