メインコンテンツまでスキップ

broadcast

ブロードキャスト結合で使用できるほど小さい DataFrame としてマークします。Spark Connect をサポートします。

構文

Python
from pyspark.sql import functions as dbf

dbf.broadcast(df=<df>)

パラメーター

パラメーター	Type	説明
`df`	`pyspark.sql.DataFrame`	ブロードキャスト参加の準備ができたとマークする DataFrame。

戻り値

pyspark.sql.DataFrame: DataFrame はブロードキャスト参加の準備が整ったとマークされています。

例

Python
from pyspark.sql import functions as dbf
df = spark.createDataFrame([1, 2, 3, 3, 4], "int")
df_small = spark.range(3)
df_b = dbf.broadcast(df_small)
df.join(df_b, df.value == df_small.id).show()

Output
+-----+---+
|value| id|
+-----+---+
|    1|  1|
|    2|  2|
+-----+---+

このページの見出し

構文
パラメーター
戻り値
例