regexp_extract
Extrai um grupo específico que corresponde à expressão regular Java regexp, da coluna de strings especificada. Se a expressão regular não corresponder, ou se o grupo especificado não corresponder, uma string vazia será retornada.
Para a função Databricks SQL correspondente, consulte a funçãoregexp_extract.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.regexp_extract(str=<str>, pattern=<pattern>, idx=<idx>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| coluna de destino para trabalhar. |
|
| Padrão de expressão regular a ser aplicado. |
|
| ID do grupo correspondente. |
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('100-200',)], ['str'])
df.select('*', dbf.regexp_extract('str', r'(\d+)-(\d+)', 1)).show()
df = spark.createDataFrame([('foo',)], ['str'])
df.select('*', dbf.regexp_extract('str', r'(\d+)', 1)).show()
df = spark.createDataFrame([('aaaac',)], ['str'])
df.select('*', dbf.regexp_extract(dbf.col('str'), '(a+)(b)?(c)', 2)).show()