有効なUTF8
無効な UTF-8 バイト シーケンスがある場合は、それをすべて Unicode 置換文字 (U+FFFD) に置き換えた新しい文字列を返します。
対応する Databricks SQL 関数については、 make_valid_utf8関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.make_valid_utf8(str=<str>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| それぞれが UTF-8 バイト シーケンスを表す文字列の列。 |
戻り値
pyspark.sql.Column: 指定された入力文字列の有効な UTF-8 バージョン。
例
Python
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()