部分文字列

str が文字列型の場合、部分文字列はposで始まり、長さはlenです。str がバイナリ型の場合、バイト単位でposで始まり、長さはlenのバイト配列のスライスを返します。

位置はゼロベースではなく、1 ベースのインデックスです。

対応する Databricks SQL 関数については、 substring関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

パラメーター

パラメーター	Type	説明
`str`	`pyspark.sql.Column` または `str`	取り組むターゲットカラム。
`pos`	`pyspark.sql.Column` または`str`または `int`	str 内の開始位置。
`len`	`pyspark.sql.Column` または`str`または `int`	文字の長さ。

パラメーター	Type	説明
`str`	`pyspark.sql.Column` または `str`	取り組むターゲットカラム。
`pos`	`pyspark.sql.Column` または`str`または `int`	str 内の開始位置。
`len`	`pyspark.sql.Column` または`str`または `int`	文字の長さ。

戻り値

pyspark.sql.Column: 指定された値の部分文字列。

例

Python
from pyspark.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()

構文​

パラメーター​

戻り値​

例​

構文

パラメーター

戻り値

例