Pular para o conteúdo principal

make_valid_utf8

Retorna uma nova string na qual todas as sequências de bytes UTF-8 inválidas, se houver, são substituídas pelo caractere de substituição Unicode (U+FFFD).

Para a função Databricks SQL correspondente, consulte a funçãomake_valid_utf8.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

Uma coluna de strings, cada uma representando uma sequência de bytes UTF-8.

Devoluções

pyspark.sql.Column: a versão UTF-8 válida das strings de entrada fornecidas.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()