部分文字列
str が文字列型の場合、部分文字列はposで始まり、長さはlenです。str がバイナリ型の場合、バイト単位でposで始まり、長さはlenのバイト配列のスライスを返します。
位置はゼロベースではなく、1 ベースのインデックスです。
対応する Databricks SQL 関数については、 substring関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.substring(str=<str>, pos=<pos>, len=<len>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 取り組むターゲットカラム。 |
|
| str 内の開始位置。 |
|
| 文字の長さ。 |
戻り値
pyspark.sql.Column: 指定された値の部分文字列。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()