メインコンテンツまでスキップ

部分文字列

str が文字列型の場合、部分文字列はposで始まり、長さはlenです。str がバイナリ型の場合、バイト単位でposで始まり、長さはlenのバイト配列のスライスを返します。

位置はゼロベースではなく、1 ベースのインデックスです。

対応する Databricks SQL 関数については、 substring関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

パラメーター

パラメーター

Type

説明

str

pyspark.sql.Column または str

取り組むターゲットカラム。

pos

pyspark.sql.Column またはstrまたは int

str 内の開始位置。

len

pyspark.sql.Column またはstrまたは int

文字の長さ。

戻り値

pyspark.sql.Column: 指定された値の部分文字列。

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()