メインコンテンツまでスキップ

スキーマ

入力スキーマを指定します。一部のデータソース(JSONなど)は、データから入力スキーマを自動的に推測できます。ここでスキーマを指定することで、基となるデータソースはスキーマ推論のステップを省略でき、データ読み込み速度が向上します。

構文

schema(schema)

パラメーター

パラメーター

Type

説明

schema

構造体型またはstr

StructTypeオブジェクトまたは DDL 形式の文字列 (例: 'col0 INT, col1 DOUBLE' )。

戻り値

DataFrameReader

CSVファイルを読み込む際に、スキーマを指定してください。

Python
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.read.schema("col0 INT, col1 DOUBLE").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: double (nullable = true)
このページの見出し