メインコンテンツまでスキップ

爆発外側

指定された配列またはマップ内の各要素に対して新しい行を返します。爆発とは異なり、配列/マップが null または空の場合、null が生成されます。特に指定がない限り、配列内の要素にはデフォルトの列名colを使用し、マップ内の要素にはkeyvalue使用します。

構文

Python
from pyspark.sql import functions as sf

sf.explode_outer(col)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または列名

取り組むターゲットカラム。

戻り値

pyspark.sql.Column: 配列項目またはマップキー値ごとに 1 行。

例1 :配列列の使用

Python
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,ARRAY(1,2,3,NULL)), (2,ARRAY()), (3,NULL) AS t(i,a)')
df.select('*', sf.explode_outer('a')).show()
Output
+---+---------------+----+
| i| a| col|
+---+---------------+----+
| 1|[1, 2, 3, NULL]| 1|
| 1|[1, 2, 3, NULL]| 2|
| 1|[1, 2, 3, NULL]| 3|
| 1|[1, 2, 3, NULL]|NULL|
| 2| []|NULL|
| 3| NULL|NULL|
+---+---------------+----+

例2 : マップ列の使用

Python
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,MAP(1,2,3,4,5,NULL)), (2,MAP()), (3,NULL) AS t(i,m)')
df.select('*', sf.explode_outer('m')).show(truncate=False)
Output
+---+---------------------------+----+-----+
|i |m |key |value|
+---+---------------------------+----+-----+
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|1 |2 |
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|3 |4 |
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|5 |NULL |
|2 |{} |NULL|NULL |
|3 |NULL |NULL|NULL |
+---+---------------------------+----+-----+