TableValuedFunction.stack
Separa col1, ..., colk em n linhas. Por default utiliza os nomes de coluna col0, col1, etc., a menos que seja especificado o contrário.
Sintaxe
Python
spark.tvf.stack(n, *fields)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| O número de linhas a separar. |
|
| Elementos de entrada a serem separados. |
Devoluções
pyspark.sql.DataFrameUm DataFrame com as linhas empilhadas.
Exemplos
Python
import pyspark.sql.functions as sf
spark.tvf.stack(sf.lit(2), sf.lit(1), sf.lit(2), sf.lit(3)).show()
Output
+----+----+
|col0|col1|
+----+----+
| 1| 2|
| 3|NULL|
+----+----+