スキーマ
入力スキーマを指定します。一部のデータソース(JSONなど)は、データから入力スキーマを自動的に推測できます。ここでスキーマを指定することで、基となるデータソースはスキーマ推論のステップを省略でき、データ読み込み速度が向上します。
構文
schema(schema)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| 構造体型またはstr |
|
戻り値
DataFrameReader
例
CSVファイルを読み込む際に、スキーマを指定してください。
Python
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.read.schema("col0 INT, col1 DOUBLE").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: double (nullable = true)