Pular para o conteúdo principal

regexp_extract_all

Extraia todas as strings em str que correspondem à expressão regular Java regexp e ao índice do grupo de expressões regulares.

Para a função Databricks SQL correspondente, consulte a funçãoregexp_extract_all.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.regexp_extract_all(str=<str>, regexp=<regexp>, idx=<idx>)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

coluna de destino para trabalhar.

regexp

pyspark.sql.Column ou str

Padrão de expressão regular a ser aplicado.

idx

pyspark.sql.Column ou int, optional

ID do grupo correspondente.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("100-200, 300-400", r"(\d+)-(\d+)")], ["str", "regexp"])
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'))).show()
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'), 2)).show()
df.select('*', dbf.regexp_extract_all('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_extract_all(dbf.col('str'), "regexp")).show()