withColumn
列を追加するか、同じ名前の既存の列を置き換えることで、新しいDataFrameを返します。
構文
withColumn(colName: str, col: Column)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| str | 文字列、新しい列の名前。 |
| 列 | 新しい列の列式。 |
戻り値
DataFrame: 新規または置換された列を含むDataFrame 。
注意
この方法は内部的に射影を導入します。したがって、たとえばループを使用して複数の列を追加するなど、これを複数回呼び出すと、パフォーマンスの問題やStackOverflowExceptionを引き起こす可能性のある大きなプランが生成される可能性があります。これを回避するには、 select複数の列で同時に使用してください。
例
Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+