Pular para o conteúdo principal

linhasEntre (Janela)

Cria um WindowSpec com os limites da moldura definidos, de start (inclusive) a end (inclusive).

Tanto start quanto end são posições relativas a partir da linha atual. Por exemplo, 0 significa "linha atual", -1 significa a linha anterior à linha atual e 5 significa a quinta linha após a linha atual.

Um limite baseado em linhas é definido com base na posição da linha dentro da partição. Um deslocamento indica o número de linhas acima ou abaixo da linha atual onde o quadro começa ou termina.

Sintaxe

Window.rowsBetween(start, end)

Parâmetros

Parâmetro

Tipo

Descrição

start

int

O limite começa, inclusivo. O quadro é ilimitado se for Window.unboundedPreceding, ou qualquer valor menor ou igual a -9223372036854775808.

end

int

Fim do limite, inclusive. O quadro é ilimitado se for Window.unboundedFollowing, ou qualquer valor maior ou igual a 9223372036854775807.

Devoluções

WindowSpec

Notas

Use Window.unboundedPreceding, Window.unboundedFollowing e Window.currentRow para especificar valores de limite especiais em vez de usar valores inteiros diretamente.

Exemplos

Python
from pyspark.sql import Window, functions as sf

df = spark.createDataFrame(
[(1, "a"), (1, "a"), (2, "a"), (1, "b"), (2, "b"), (3, "b")], ["id", "category"])

# Calculate the sum of id from the current row to current row + 1 in each category partition.
window = Window.partitionBy("category").orderBy("id").rowsBetween(Window.currentRow, 1)
df.withColumn("sum", sf.sum("id").over(window)).sort("id", "category", "sum").show()
# +---+--------+---+
# | id|category|sum|
# +---+--------+---+
# | 1| a| 2|
# | 1| a| 3|
# | 1| b| 3|
# | 2| a| 2|
# | 2| b| 5|
# | 3| b| 3|
# +---+--------+---+