部分文字列インデックス
文字列 str から、区切り文字 delim が count 回出現する前の部分文字列を返します。count が正の場合、最後の区切り文字の左側 (左から数えて) にあるすべてが返されます。count が負の場合、最後の区切り文字の右側(右から数えて)すべてが返されます。substring_index は、delim を検索するときに大文字と小文字を区別した一致を実行します。
対応する Databricks SQL 関数については、 substring_index関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.substring_index(str=<str>, delim=<delim>, count=<count>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 取り組むターゲットカラム。 |
|
| 値の区切り文字。 |
|
| 発生回数。 |
戻り値
pyspark.sql.Column: 指定された値の部分文字列。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()