メインコンテンツまでスキップ

有効なUTF8

無効な UTF-8 バイト シーケンスがある場合は、それをすべて Unicode 置換文字 (U+FFFD) に置き換えた新しい文字列を返します。

対応する Databricks SQL 関数については、 make_valid_utf8関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

パラメーター

パラメーター

Type

説明

str

pyspark.sql.Column または str

それぞれが UTF-8 バイト シーケンスを表す文字列の列。

戻り値

pyspark.sql.Column: 指定された入力文字列の有効な UTF-8 バージョン。

Python
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()