メインコンテンツまでスキップ

連合

このデータフレームと別のDataFrame行の和集合を含む新しいDataFrameを返します。

構文

union(other: "DataFrame")

パラメーター

パラメーター

Type

説明

other

データフレーム

結合する必要のある別のDataFrame 。

戻り値

DataFrame結合された行とそれに対応する列を含む新しいDataFrame 。

注意

このメソッドは、 DataFrameオブジェクトの両方の行を SQL スタイルの集合結合で結合しますが、要素の自動重複排除は行いません。

行の重複排除を実行するには、 distinct()メソッドを使用します。

このメソッドは、SQLの標準的な動作に従い、列を名前ではなく位置によって解決します。

Python
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+