順序
開始から終了まで、ステップごとに増加しながら整数のシーケンスを生成します。ステップが設定されていない場合、関数は start が stop 以下の場合は 1 増加し、それ以外の場合は 1 減少します。
構文
Python
from pyspark.sql import functions as sf
sf.sequence(start, stop, step=None)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| シーケンスの開始値(含む)。 |
|
| シーケンスの最後の値(含む)。 |
|
| シーケンス内の次の要素を取得するために現在の要素に追加する値。デフォルトは、start が stop 以下の場合は 1、それ以外の場合は -1 です。 |
戻り値
pyspark.sql.Column: シーケンス値の配列を含む新しい列。
例
例1 : デフォルトステップでシーケンスを生成する
Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(-2, 2)], ['start', 'stop'])
df.select(sf.sequence(df.start, df.stop)).show()
Output
+---------------------+
|sequence(start, stop)|
+---------------------+
| [-2, -1, 0, 1, 2]|
+---------------------+
例2 : カスタムステップでシーケンスを生成する
Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(4, -4, -2)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
Output
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [4, 2, 0, -2, -4]|
+---------------------------+
例3 : 負のステップを持つシーケンスを生成する
Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(5, 1, -1)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
Output
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [5, 4, 3, 2, 1]|
+---------------------------+