ストリーミングクエリ
新しいデータが到着するたびにバックグラウンドで継続的に実行されるクエリへのハンドル。すべてのメソッドはスレッドセーフです。
構文
Python
# Returned by DataStreamWriter.start() or DataStreamWriter.toTable()
q = df.writeStream.format("console").start()
物件
属性 | 説明 |
|---|---|
チェックポイントデータから、再起動後も保持されるこのクエリの一意のIDを返します。 | |
再起動後も保持されない、このクエリの一意のIDを返します。 | |
ユーザーが指定したクエリ名を返します。指定されていない場合は | |
このストリーミングクエリが現在アクティブかどうかを返します。 | |
クエリの現在のステータスを辞書として返します。 | |
このクエリに対する最新の更新情報 | |
最新の更新が |
方法
手法 | 説明 |
|---|---|
| |
ソース内の利用可能なすべてのデータが処理され、シンクにコミットされるまでブロックします。テスト目的のみに使用されます。 | |
このストリーミングクエリを停止します。 | |
デバッグのために、(論理プランと物理プランの)実行計画をコンソールに出力します。 | |
クエリが例外で終了した場合は |
例
Python
sdf = spark.readStream.format("rate").load()
sq = sdf.writeStream.format('memory').queryName('this_query').start()
sq.isActive
# True
sq.name
# 'this_query'
sq.awaitTermination(5)
# False
sq.stop()
sq.isActive
# False