〜番号
文字列 'col' を文字列形式 'format' に基づいて数値に変換します。変換に失敗した場合は例外をスローします。
形式は次の文字で構成できます (大文字と小文字は区別されません)。
- 「0」または「9」: 0 から 9 までの予想される数字を指定します。フォーマット文字列内の 0 または 9 のシーケンスは、入力文字列内の数字のシーケンスと一致します。0/9 のシーケンスが 0 で始まり、小数点の前にある場合、同じサイズの数字シーケンスとのみ一致します。それ以外の場合、シーケンスが9で始まるか、 小数点の場合、同じかそれより小さいサイズの数字シーケンスと一致できます。
- '.' または 'D': 小数点の位置を指定します (オプション、1 回のみ許可)。
- ',' または 'G': グループ (千単位) 区切り記号 (,) の位置を指定します。各グループ化区切り文字の左側と右側には 0 または 9 が必要です。「col」は、数値のサイズに関連するグループ化区切り文字と一致する必要があります。
- '$': $ 通貨記号の位置を指定します。この文字は 1 回だけ指定できます。
- 「S」または「MI」: 「-」または「+」記号の位置を指定します (オプション、書式文字列の先頭または末尾に 1 回のみ使用できます)。「S」では「-」が許可されますが、「MI」では許可されないことに注意してください。
- 'PR': 書式文字列の末尾でのみ使用できます。'col' が 山括弧で囲まれた負の数。
対応する Databricks SQL 関数については、 to_number関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.to_number(col=<col>, format=<format>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 列または文字列を入力します。 |
|
| 数値を変換するために使用する形式。 |
例
Python
df = spark.createDataFrame([("$78.12",)], ["e"])
df.select(to_number(df.e, lit("$99.99")).alias('r')).collect()