メインコンテンツまでスキップ

インラインアウター

構造体の配列をテーブルに展開します。インラインとは異なり、配列が null または空の場合、ネストされた列ごとに null が生成されます。

構文

Python
from pyspark.sql import functions as sf

sf.inline_outer(col)

パラメーター

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または列名	分解する値の入力列。

戻り値

pyspark.sql.Column: インライン展開された結果を持つジェネレータ式。

例

Python
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,ARRAY(NAMED_STRUCT("a",1,"b",2), NULL, NAMED_STRUCT("a",3,"b",4))), (2,ARRAY()), (3,NULL) AS t(i,s)')
df.printSchema()

Output
root
 |-- i: integer (nullable = false)
 |-- s: array (nullable = true)
 |    |-- element: struct (containsNull = true)
 |    |    |-- a: integer (nullable = false)
 |    |    |-- b: integer (nullable = false)

Python
df.select('*', sf.inline_outer('s')).show(truncate=False)

Output
+---+----------------------+----+----+
|i  |s                     |a   |b   |
+---+----------------------+----+----+
|1  |[{1, 2}, NULL, {3, 4}]|1   |2   |
|1  |[{1, 2}, NULL, {3, 4}]|NULL|NULL|
|1  |[{1, 2}, NULL, {3, 4}]|3   |4   |
|2  |[]                    |NULL|NULL|
|3  |NULL                  |NULL|NULL|
+---+----------------------+----+----+

このページの見出し

構文
パラメーター
戻り値
例