放送
ブロードキャスト結合で使用できるほど小さい DataFrame としてマークします。Spark Connect をサポートします。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.broadcast(df=<df>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| ブロードキャスト参加の準備ができたとマークする DataFrame。 |
戻り値
pyspark.sql.DataFrame: DataFrame はブロードキャスト参加の準備が整ったとマークされています。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1, 2, 3, 3, 4], "int")
df_small = spark.range(3)
df_b = dbf.broadcast(df_small)
df.join(df_b, df.value == df_small.id).show()
Output
+-----+---+
|value| id|
+-----+---+
| 1| 1|
| 2| 2|
+-----+---+