正規表現抽出すべて

Java 正規表現regexpに一致し、正規表現グループインデックスに対応するstr内のすべての文字列を抽出します。

対応する Databricks SQL 関数については、 regexp_extract_all関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.regexp_extract_all(str=<str>, regexp=<regexp>, idx=<idx>)

パラメーター

パラメーター	Type	説明
`str`	`pyspark.sql.Column` または `str`	取り組むターゲットカラム。
`regexp`	`pyspark.sql.Column` または `str`	適用する正規表現パターン。
`idx`	`pyspark.sql.Column` または `int, optional`	一致したグループ ID。

パラメーター	Type	説明
`str`	`pyspark.sql.Column` または `str`	取り組むターゲットカラム。
`regexp`	`pyspark.sql.Column` または `str`	適用する正規表現パターン。
`idx`	`pyspark.sql.Column` または `int, optional`	一致したグループ ID。

例

Python
from pyspark.sql import functions as dbf
df = spark.createDataFrame([("100-200, 300-400", r"(\d+)-(\d+)")], ["str", "regexp"])
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'))).show()
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'), dbf.lit(1))).show()
df.select('*', dbf.regexp_extract_all('str', dbf.lit(r'(\d+)-(\d+)'), 2)).show()
df.select('*', dbf.regexp_extract_all('str', dbf.col("regexp"))).show()
df.select('*', dbf.regexp_extract_all(dbf.col('str'), "regexp")).show()

構文​

パラメーター​

例​

構文

パラメーター

例