ランドン
標準正規分布から、独立かつ同一に分布した (iid) サンプルを含むランダムな列を生成します。Spark Connect をサポートします。
対応する Databricks SQL 関数については、 randn関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.randn(seed=<seed>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 乱数ジェネレータのシード値。 |
戻り値
pyspark.sql.Column: ランダムな値の列。
例
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn()).show() # doctest: +SKIP
Output
+---+--------------------------+
| id|randn(3968742514375399317)|
+---+--------------------------+
| 0| -0.47968645355788...|
| 1| -0.4950952457305...|
+---+--------------------------+
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| randn(42)|
+---+------------------+
| 0| 2.384479054241...|
| 1|0.1920934041293...|
+---+------------------+