メインコンテンツまでスキップ

json_tuple

指定されたフィールド名に従って、JSON 列の新しい行を作成します。

構文

Python
from pyspark.sql import functions as sf

sf.json_tuple(col, *fields)

パラメーター

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または文字列	JSON形式の文字列列。
`fields`	str	抽出するフィールド。

戻り値

pyspark.sql.Column: JSONオブジェクトから指定されたフィールド値ごとに新しい行を作成します

例

Python
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()

Output
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]

このページの見出し

構文
パラメーター
戻り値
例