メインコンテンツまでスキップ

パースJSON

JSON 文字列を含む列をVariantTypeに解析します。文字列が無効な JSON 値を表している場合は例外をスローします。

構文

Python
from pyspark.sql import functions as sf

sf.parse_json(col)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または文字列

列または列名の JSON 形式の文字列。

戻り値

pyspark.sql.Column: VariantType の新しい列。

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''} ])
df.select(sf.to_json(sf.parse_json(df.json))).collect()
Output
[Row(to_json(parse_json(json))='{"a":1}')]