メインコンテンツまでスキップ

ドロップ( DataFrame )

指定された列を含まない新しいDataFrameを返します。 スキーマに指定された列名が含まれていない場合、この操作は実行されません。

構文

drop(*cols: "ColumnOrName")

パラメーター

パラメーター

Type

説明

cols

文字列または列

列名、または削除する列。

戻り値

DataFrame指定された列を含まない新しいDataFrame 。

注意

入力が列名である場合、それ以上の解釈なしに文字通りに扱われます。そうでない場合は、同等の式との照合を試みます。したがって、列名drop(colName)を指定して列を削除することと、列drop(col(colName))を直接削除することは、意味が異なります。

Python
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+