ドロップ( DataFrame )
指定された列を含まない新しいDataFrameを返します。 スキーマに指定された列名が含まれていない場合、この操作は実行されません。
構文
drop(*cols: "ColumnOrName")
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| 文字列または列 | 列名、または削除する列。 |
戻り値
DataFrame指定された列を含まない新しいDataFrame 。
注意
入力が列名である場合、それ以上の解釈なしに文字通りに扱われます。そうでない場合は、同等の式との照合を試みます。したがって、列名drop(colName)を指定して列を削除することと、列drop(col(colName))を直接削除することは、意味が異なります。
例
Python
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+