embaralhar

Gera uma permutação aleatória da matriz fornecida. A função de embaralhamento não é determinística, o que significa que a ordem da matriz de saída pode ser diferente a cada execução.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.shuffle(col, seed=None)

Parâmetros

Parâmetro	Tipo	Descrição
`col`	`pyspark.sql.Column` ou str	O nome da coluna ou expressão a ser embaralhada.
`seed`	`pyspark.sql.Column` ou int, opcional	Valor inicial para o gerador de números aleatórios. Adicionado no Databricks Runtime 16.1

Parâmetro	Tipo	Descrição
`col`	`pyspark.sql.Column` ou str	O nome da coluna ou expressão a ser embaralhada.
`seed`	`pyspark.sql.Column` ou int, opcional	Valor inicial para o gerador de números aleatórios. Adicionado no Databricks Runtime 16.1

Devoluções

pyspark.sql.ColumnUma nova coluna que contém uma matriz de elementos em ordem aleatória.

Exemplos

Exemplo 1 : Embaralhando um array simples

Python
import pyspark.sql.functions as sf
df = spark.sql("SELECT ARRAY(1, 20, 3, 5) AS data")
df.select("*", sf.shuffle(df.data, sf.lit(123))).show()

Output
+-------------+-------------+
|         data|shuffle(data)|
+-------------+-------------+
|[1, 20, 3, 5]|[5, 1, 20, 3]|
+-------------+-------------+

Exemplo 2 : Embaralhando um array com valores nulos

Python
import pyspark.sql.functions as sf
df = spark.sql("SELECT ARRAY(1, 20, NULL, 5) AS data")
df.select("*", sf.shuffle(sf.col("data"), 234)).show()

Output
+----------------+----------------+
|            data|   shuffle(data)|
+----------------+----------------+
|[1, 20, NULL, 5]|[NULL, 5, 20, 1]|
+----------------+----------------+

Exemplo 3 : Embaralhando um array com valores duplicados

Python
import pyspark.sql.functions as sf
df = spark.sql("SELECT ARRAY(1, 2, 2, 3, 3, 3) AS data")
df.select("*", sf.shuffle("data", 345)).show()

Output
+------------------+------------------+
|              data|     shuffle(data)|
+------------------+------------------+
|[1, 2, 2, 3, 3, 3]|[2, 3, 3, 1, 2, 3]|
+------------------+------------------+

Sintaxe​

Parâmetros​

Devoluções​

Exemplos​

Sintaxe

Parâmetros

Devoluções

Exemplos