regexp_instr
Retorna a posição da primeira substring em str que corresponde à expressão regular Java regexp e correspondente ao índice do grupo de expressão regular.
Para a função Databricks SQL correspondente, consulte a funçãoregexp_instr.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.regexp_instr(str=<str>, regexp=<regexp>, idx=<idx>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| coluna de destino para trabalhar. |
|
| Padrão de expressão regular a ser aplicado. |
|
| ID do grupo correspondente. |
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+(a|b|m)")], ["str", "regexp"])
Python
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'))).show()
df.select('*', dbf.regexp_instr('str', dbf.lit(r'\d+(a|b|m)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_instr('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_instr(dbf.col("str"), "regexp")).show()