rand
Gera uma coluna aleatória com amostras independentes e identicamente distribuídas (iid) uniformemente distribuídas em [0.0, 1.0). Compatível com Spark Connect.
A função não é determinística no caso geral.
Para a função Databricks SQL correspondente, consulte a funçãorand.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.rand(seed=<seed>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Valor inicial para o gerador de números aleatórios. |
Devoluções
pyspark.sql.ColumnUma coluna de valores aleatórios.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
Output
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
| 0| 0.9253464547887...|
| 1| 0.6533254118758...|
+---+-------------------------+
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| rand(42)|
+---+------------------+
| 0| 0.619189370225...|
| 1|0.5096018842446...|
+---+------------------+