メインコンテンツまでスキップ

スキーマ( DataFrame )

このDataFrameのスキーマをStructTypeとして返します。

戻り値

StructType

現在のDataFrameの推論されたスキーマを取得します。

Python
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.schema
# StructType([StructField('age', LongType(), True),
# StructField('name', StringType(), True)])

DDL形式のスキーマ文字列から、現在のDataFrameのスキーマを取得します。

Python
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")],
"age INT, name STRING")
df.schema
# StructType([StructField('age', IntegerType(), True),
# StructField('name', StringType(), True)])

現在のDataFrameの指定されたスキーマを取得します。

Python
from pyspark.sql.types import StructType, StructField, StringType
df = spark.createDataFrame(
[("a",), ("b",), ("c",)],
StructType([StructField("value", StringType(), False)]))
df.schema
# StructType([StructField('value', StringType(), False)])
このページの見出し