Pular para o conteúdo principal

esquema_de_json

Analisa uma string JSON e infere seu esquema no formato DDL.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.schema_of_json(json, options=None)

Parâmetros

Parâmetro

Tipo

Descrição

json

pyspark.sql.Column ou str

Uma coluna de strings JSON ou uma coluna de strings recolhíveis contendo strings JSON .

options

dicionário, opcional

Opções para controlar a análise sintática. Aceita as mesmas opções que a fonte de dados JSON.

Devoluções

pyspark.sql.Column: uma representação em string de um StructType analisado a partir JSON fornecido.

Exemplos

Python
import pyspark.sql.functions as sf
parsed1 = sf.schema_of_json(sf.lit('{"a": 0}'))
parsed2 = sf.schema_of_json('{a: 1}', {'allowUnquotedFieldNames':'true'})
spark.range(1).select(parsed1, parsed2).show()
Output
+------------------------+----------------------+
|schema_of_json({"a": 0})|schema_of_json({a: 1})|
+------------------------+----------------------+
| STRUCT<a: BIGINT>| STRUCT<a: BIGINT>|
+------------------------+----------------------+