Pular para o conteúdo principal

randn

Gera uma coluna aleatória com amostras independentes e identicamente distribuídas (iid) da distribuição normal padrão. Compatível com Spark Connect.

Para a função Databricks SQL correspondente, consulte a funçãorandn.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.randn(seed=<seed>)

Parâmetros

Parâmetro

Tipo

Descrição

seed

int (default: None)

Valor inicial para o gerador de números aleatórios.

Devoluções

pyspark.sql.ColumnUma coluna de valores aleatórios.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn()).show() # doctest: +SKIP
Output
+---+--------------------------+
| id|randn(3968742514375399317)|
+---+--------------------------+
| 0| -0.47968645355788...|
| 1| -0.4950952457305...|
+---+--------------------------+

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| randn(42)|
+---+------------------+
| 0| 2.384479054241...|
| 1|0.1920934041293...|
+---+------------------+