メインコンテンツまでスキップ

順序

開始から終了まで、ステップごとに増加しながら整数のシーケンスを生成します。ステップが設定されていない場合、関数は start が stop 以下の場合は 1 増加し、それ以外の場合は 1 減少します。

構文

Python
from pyspark.sql import functions as sf

sf.sequence(start, stop, step=None)

パラメーター

パラメーター

Type

説明

start

pyspark.sql.Column または文字列

シーケンスの開始値(含む)。

stop

pyspark.sql.Column または文字列

シーケンスの最後の値(含む)。

step

pyspark.sql.Column または文字列(オプション)

シーケンス内の次の要素を取得するために現在の要素に追加する値。デフォルトは、start が stop 以下の場合は 1、それ以外の場合は -1 です。

戻り値

pyspark.sql.Column: シーケンス値の配列を含む新しい列。

例1 : デフォルトステップでシーケンスを生成する

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(-2, 2)], ['start', 'stop'])
df.select(sf.sequence(df.start, df.stop)).show()
Output
+---------------------+
|sequence(start, stop)|
+---------------------+
| [-2, -1, 0, 1, 2]|
+---------------------+

例2 : カスタムステップでシーケンスを生成する

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(4, -4, -2)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
Output
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [4, 2, 0, -2, -4]|
+---------------------------+

例3 : 負のステップを持つシーケンスを生成する

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(5, 1, -1)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
Output
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [5, 4, 3, 2, 1]|
+---------------------------+