Pular para o conteúdo principal

regexp_extract

Extrai um grupo específico que corresponde à expressão regular Java regexp, da coluna de strings especificada. Se a expressão regular não corresponder, ou se o grupo especificado não corresponder, uma string vazia será retornada.

Para a função Databricks SQL correspondente, consulte a funçãoregexp_extract.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.regexp_extract(str=<str>, pattern=<pattern>, idx=<idx>)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

coluna de destino para trabalhar.

pattern

str

Padrão de expressão regular a ser aplicado.

idx

int

ID do grupo correspondente.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('100-200',)], ['str'])
df.select('*', dbf.regexp_extract('str', r'(\d+)-(\d+)', 1)).show()
df = spark.createDataFrame([('foo',)], ['str'])
df.select('*', dbf.regexp_extract('str', r'(\d+)', 1)).show()
df = spark.createDataFrame([('aaaac',)], ['str'])
df.select('*', dbf.regexp_extract(dbf.col('str'), '(a+)(b)?(c)', 2)).show()