soltar (DataFrame)
Retorna um novo DataFrame sem as colunas especificadas. Esta operação não terá efeito se o esquema não contiver o(s) nome(s) de coluna fornecido(s).
Sintaxe
drop(*cols: "ColumnOrName")
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| str ou Coluna | Nome da coluna, ou a coluna a ser removida. |
Devoluções
DataFrameUm novo DataFrame sem as colunas especificadas.
Notas
Quando uma entrada é um nome de coluna, ela é tratada literalmente, sem qualquer interpretação adicional. Caso contrário, tentará encontrar uma expressão equivalente. Portanto, excluir uma coluna pelo seu nome drop(colName) tem uma semântica diferente de excluir diretamente a coluna drop(col(colName)).
Exemplos
Python
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+