Pular para o conteúdo principal

Função definida pelo usuário

Uma função definida pelo usuário em Python.

O construtor desta classe não deve ser chamado diretamente. Use pyspark.sql.functions.udf ou pyspark.sql.functions.pandas_udf para criar uma instância.

Sintaxe

Python
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

my_udf = udf(lambda x: x.upper(), StringType())

Propriedades

Propriedade

Descrição

returnType

O tipo de retorno da função definida pelo usuário como um DataType.

Métodos

Método

Descrição

asNondeterministic()

Atualiza a função definida pelo usuário para não determinística.

Exemplos

Python
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
Output
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
Python
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType

random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
Output
IntegerType()