Pular para o conteúdo principal

inline_outer

Transforma um array de structs em uma tabela. Diferentemente do método inline, se a matriz for nula ou vazia, será gerado um valor nulo para cada coluna aninhada.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.inline_outer(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

Coluna de entrada com os valores a serem explodidos.

Devoluções

pyspark.sql.Column: expressão geradora com o resultado explodido embutido.

Exemplos

Python
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,ARRAY(NAMED_STRUCT("a",1,"b",2), NULL, NAMED_STRUCT("a",3,"b",4))), (2,ARRAY()), (3,NULL) AS t(i,s)')
df.printSchema()
Output
root
|-- i: integer (nullable = false)
|-- s: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- a: integer (nullable = false)
| | |-- b: integer (nullable = false)
Python
df.select('*', sf.inline_outer('s')).show(truncate=False)
Output
+---+----------------------+----+----+
|i |s |a |b |
+---+----------------------+----+----+
|1 |[{1, 2}, NULL, {3, 4}]|1 |2 |
|1 |[{1, 2}, NULL, {3, 4}]|NULL|NULL|
|1 |[{1, 2}, NULL, {3, 4}]|3 |4 |
|2 |[] |NULL|NULL|
|3 |NULL |NULL|NULL|
+---+----------------------+----+----+