organizar
Retorna um novo DataFrame ordenado pelas colunas especificadas.
Sintaxe
sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| int, str, lista ou coluna, opcional | Lista de colunas, nomes de colunas ou valores ordinais das colunas para ordenar. |
| booleano ou lista, opcional, default True | Valor booleano ou lista de valores booleanos. Ordenar em ordem crescente ou decrescente. Especifique a lista para várias ordens de classificação. Se uma lista for especificada, o comprimento da lista deve ser igual ao comprimento de |
Devoluções
DataFrame: DataFrame ordenado.
Notas
Um ordinal de coluna começa em 1, o que é diferente de __getitem__ baseado em 0. Se o valor ordinal de uma coluna for negativo, significa que a classificação é decrescente.
Exemplos
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([
(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+
df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 5| Bob|
# | 2|Alice|
# +---+-----+
df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 5| Bob|
# | 2|Alice|
# +---+-----+
df = spark.createDataFrame([
(2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# | 5| Bob|
# | 2|Alice|
# | 2| Bob|
# +---+-----+