Pular para o conteúdo principal

rand

Gera uma coluna aleatória com amostras independentes e identicamente distribuídas (iid) uniformemente distribuídas em [0.0, 1.0). Compatível com Spark Connect.

A função não é determinística no caso geral.

Para a função Databricks SQL correspondente, consulte a funçãorand.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.rand(seed=<seed>)

Parâmetros

Parâmetro

Tipo

Descrição

seed

int, optional

Valor inicial para o gerador de números aleatórios.

Devoluções

pyspark.sql.ColumnUma coluna de valores aleatórios.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
Output
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
| 0| 0.9253464547887...|
| 1| 0.6533254118758...|
+---+-------------------------+

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| rand(42)|
+---+------------------+
| 0| 0.619189370225...|
| 1|0.5096018842446...|
+---+------------------+