メインコンテンツまでスキップ

ランドン

標準正規分布から、独立かつ同一に分布した (iid) サンプルを含むランダムな列を生成します。Spark Connect をサポートします。

対応する Databricks SQL 関数については、 randn関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.randn(seed=<seed>)

パラメーター

パラメーター

Type

説明

seed

int (default: None)

乱数ジェネレータのシード値。

戻り値

pyspark.sql.Column: ランダムな値の列。

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn()).show() # doctest: +SKIP
Output
+---+--------------------------+
| id|randn(3968742514375399317)|
+---+--------------------------+
| 0| -0.47968645355788...|
| 1| -0.4950952457305...|
+---+--------------------------+

Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| randn(42)|
+---+------------------+
| 0| 2.384479054241...|
| 1|0.1920934041293...|
+---+------------------+