json_tuple
Cria uma nova linha para uma coluna JSON de acordo com os nomes de campo fornecidos.
Sintaxe
Python
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Coluna de strings em formato JSON . |
| str | Um ou mais campos para extrair. |
Devoluções
pyspark.sql.Column: uma nova linha para cada valor de campo fornecido do objeto JSON
Exemplos
Python
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
Output
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]