〜番号

文字列 'col' を文字列形式 'format' に基づいて数値に変換します。変換に失敗した場合は例外をスローします。

形式は次の文字で構成できます (大文字と小文字は区別されません)。

「0」または「9」: 0 から 9 までの予想される数字を指定します。フォーマット文字列内の 0 または 9 のシーケンスは、入力文字列内の数字のシーケンスと一致します。0/9 のシーケンスが 0 で始まり、小数点の前にある場合、同じサイズの数字シーケンスとのみ一致します。それ以外の場合、シーケンスが9で始まるか、小数点の場合、同じかそれより小さいサイズの数字シーケンスと一致できます。
'.' または 'D': 小数点の位置を指定します (オプション、1 回のみ許可)。
',' または 'G': グループ (千単位) 区切り記号 (,) の位置を指定します。各グループ化区切り文字の左側と右側には 0 または 9 が必要です。「col」は、数値のサイズに関連するグループ化区切り文字と一致する必要があります。
'$': $ 通貨記号の位置を指定します。この文字は 1 回だけ指定できます。
「S」または「MI」: 「-」または「+」記号の位置を指定します (オプション、書式文字列の先頭または末尾に 1 回のみ使用できます)。「S」では「-」が許可されますが、「MI」では許可されないことに注意してください。
'PR': 書式文字列の末尾でのみ使用できます。'col' が山括弧で囲まれた負の数。

対応する Databricks SQL 関数については、 to_number関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.to_number(col=<col>, format=<format>)

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または `str`	列または文字列を入力します。
`format`	`pyspark.sql.Column` または `str, optional`	数値を変換するために使用する形式。

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または `str`	列または文字列を入力します。
`format`	`pyspark.sql.Column` または `str, optional`	数値を変換するために使用する形式。

Python
df = spark.createDataFrame([("$78.12",)], ["e"])
df.select(to_number(df.e, lit("$99.99")).alias('r')).collect()