randn
Gera uma coluna aleatória com amostras independentes e identicamente distribuídas (iid) da distribuição normal padrão. Compatível com Spark Connect.
Para a função Databricks SQL correspondente, consulte a funçãorandn.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.randn(seed=<seed>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Valor inicial para o gerador de números aleatórios. |
Devoluções
pyspark.sql.ColumnUma coluna de valores aleatórios.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn()).show() # doctest: +SKIP
Output
+---+--------------------------+
| id|randn(3968742514375399317)|
+---+--------------------------+
| 0| -0.47968645355788...|
| 1| -0.4950952457305...|
+---+--------------------------+
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| randn(42)|
+---+------------------+
| 0| 2.384479054241...|
| 1|0.1920934041293...|
+---+------------------+