com coluna
Retorna um novo DataFrame adicionando uma coluna ou substituindo a coluna existente que possui o mesmo nome.
Sintaxe
withColumn(colName: str, col: Column)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| str | strings, nome da nova coluna. |
| Coluna | Uma expressão de coluna para a nova coluna. |
Devoluções
DataFrame: DataFrame com coluna nova ou substituída.
Notas
Este método introduz uma projeção internamente. Portanto, chamá-lo várias vezes, por exemplo, por meio de loops para adicionar várias colunas pode gerar planos grandes que podem causar problemas de desempenho e até mesmo StackOverflowException. Para evitar isso, use select com várias colunas de uma só vez.
Exemplos
Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+