Pular para o conteúdo principal

regexp_substr

Retorna a primeira substring que corresponde à expressão regular Java regexp dentro das strings str. Se a expressão regular não for encontrada, o resultado será nulo.

Para a função Databricks SQL correspondente, consulte a funçãoregexp_substr.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.regexp_substr(str=<str>, regexp=<regexp>)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

coluna de destino para trabalhar.

regexp

pyspark.sql.Column ou str

Padrão de expressão regular a ser aplicado.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+")], ["str", "regexp"])
Python
df.select('*', dbf.regexp_substr('str', dbf.lit(r'\d+'))).show()
df.select('*', dbf.regexp_substr('str', dbf.lit(r'mmm'))).show()
df.select('*', dbf.regexp_substr("str", dbf.col("regexp"))).show()
df.select('*', dbf.regexp_substr(dbf.col("str"), "regexp")).show()