ランド
[0.0, 1.0)に均一に分布した、独立かつ同一に分布する (iid) サンプルを持つランダム列を生成します。Spark Connect をサポートします。
一般的なケースでは、この関数は非決定論的です。
対応する Databricks SQL 関数については、 rand関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.rand(seed=<seed>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 乱数ジェネレータのシード値。 |
戻り値
pyspark.sql.Column: ランダムな値の列。
例
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
Output
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
| 0| 0.9253464547887...|
| 1| 0.6533254118758...|
+---+-------------------------+
Python
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
Output
+---+------------------+
| id| rand(42)|
+---+------------------+
| 0| 0.619189370225...|
| 1|0.5096018842446...|
+---+------------------+