Parquet(DataStreamReader)
Parquetファイルストリームを読み込み、結果をDataFrameとして返します。
構文
parquet(path, **options)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| str | Hadoopがサポートする任意のファイルシステム内のパス。 |
戻り値
DataFrame
例
一時的なParquetファイルからストリームを読み込む:
Python
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="parquet") as d:
spark.range(10).write.mode("overwrite").format("parquet").save(d)
q = spark.readStream.schema(
"id LONG").parquet(d).writeStream.format("console").start()
time.sleep(3)
q.stop()