メインコンテンツまでスキップ

unionByName

このデータフレームと別のDataFrame行の結合を含む新しいDataFrameを返します。

構文

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

パラメーター

パラメーター

Type

説明

other

データフレーム

結合する必要のある別のDataFrame 。

allowMissingColumns

bool型、オプション、デフォルト値はFalse

欠落している列を許可するかどうかを指定します。

戻り値

DataFrame: 指定された 2 つのDataFramesの対応する列と結合された行を含む新しいDataFrame 。

注意

このメソッドは、入力された2つのDataFramesに対して結合演算を実行し、列を(位置ではなく)名前で解決します。 allowMissingColumnsがTrueの場合、欠落している列はnullで埋められます。

Python
df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# | 1| 2| 3|
# | 6| 4| 5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# | 1| 2| 3|NULL|
# |NULL| 4| 5| 6|
# +----+----+----+----+