メインコンテンツまでスキップ

有効なUTF8

無効な UTF-8 バイトシーケンスがある場合は、それをすべて Unicode 置換文字 (U+FFFD) に置き換えた新しい文字列を返します。

対応する Databricks SQL 関数については、 make_valid_utf8関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

パラメーター

パラメーター	Type	説明
`str`	`pyspark.sql.Column` または `str`	それぞれが UTF-8 バイトシーケンスを表す文字列の列。

戻り値

pyspark.sql.Column: 指定された入力文字列の有効な UTF-8 バージョン。

例

Python
from pyspark.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()

このページの見出し

構文
パラメーター
戻り値
例