メインコンテンツまでスキップ

パーセントランク

ウィンドウ関数: 相対順位を返す(つまりウィンドウ パーティション内の行のパーセンタイル。

構文

Python
from pyspark.sql import functions as sf

sf.percent_rank()

パラメーター

この機能には問題はありません。

戻り値

pyspark.sql.Column: 相対順位を計算する列。

Python
from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame([1, 1, 2, 3, 3, 4], "int")
w = Window.orderBy("value")
df.withColumn("pr", sf.percent_rank().over(w)).show()
Output
+-----+---+
|value| pr|
+-----+---+
| 1|0.0|
| 1|0.0|
| 2|0.4|
| 3|0.6|
| 3|0.6|
| 4|1.0|
+-----+---+