連結
コレクション関数: 複数の入力列を 1 つの列に連結します。この関数は、文字列、数値、バイナリ、および互換性のある配列列で機能します。Spark Connect をサポートします。
対応する Databricks SQL 関数については、 concat関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.concat(*cols)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| ターゲットカラムまたは作業する列。 |
戻り値
pyspark.sql.Column: 連結された値。Columnのタイプは入力列のタイプによって異なります。
例
例1 : 文字列列の連結
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd','123')], ['s', 'd'])
df.select(dbf.concat(df.s, df.d)).show()
Output
+------------+
|concat(s, d)|
+------------+
| abcd123|
+------------+
例2 : 配列の列を連結する
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([1, 2], [3, 4], [5]), ([1, 2], None, [3])], ['a', 'b', 'c'])
df.select(dbf.concat(df.a, df.b, df.c)).show()
Output
+---------------+
|concat(a, b, c)|
+---------------+
|[1, 2, 3, 4, 5]|
| NULL|
+---------------+