行番号
ウィンドウ関数: ウィンドウ パーティション内で 1 から始まる連続番号を返します。
構文
Python
from pyspark.sql import functions as sf
sf.row_number()
パラメーター
この機能には問題はありません。
戻り値
pyspark.sql.Column: 行番号を計算する列。
例
Python
from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.range(3)
w = Window.orderBy(df.id.desc())
df.withColumn("desc_order", sf.row_number().over(w)).show()
Output
+---+----------+
| id|desc_order|
+---+----------+
| 2| 1|
| 1| 2|
| 0| 3|
+---+----------+