メインコンテンツまでスキップ

部分文字列インデックス

文字列 str から、区切り文字 delim が count 回出現する前の部分文字列を返します。count が正の場合、最後の区切り文字の左側 (左から数えて) にあるすべてが返されます。count が負の場合、最後の区切り文字の右側(右から数えて)すべてが返されます。substring_index は、delim を検索するときに大文字と小文字を区別した一致を実行します。

対応する Databricks SQL 関数については、 substring_index関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.substring_index(str=<str>, delim=<delim>, count=<count>)

パラメーター

パラメーター

Type

説明

str

pyspark.sql.Column または str

取り組むターゲットカラム。

delim

literal string

値の区切り文字。

count

int

発生回数。

戻り値

pyspark.sql.Column: 指定された値の部分文字列。

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()