メインコンテンツまでスキップ

トリガー(DataStreamWriter)

ストリーミングクエリのトリガーを設定します。設定されていない場合、クエリは可能な限り高速に実行され、 processingTime='0 seconds'と同等になります。一度に設定できるトリガーは 1 つだけです。

詳細については、 「構造化ストリーミング トリガー間隔の構成」を参照してください。

構文

trigger(*, processingTime=None, once=None, continuous=None, availableNow=None, realTime=None)

パラメーター

パラメーター

Type

説明

processingTime

文字列、オプション

処理時間間隔文字列(例: '5 seconds''1 minute' )。処理時間に基づいて、マイクロバッチクエリを定期的に実行します。

once

ブール値、オプション

Trueの場合、1つのデータバッチのみを処理してクエリを終了します。

continuous

文字列、オプション

時間間隔を表す文字列(例: '5 seconds' )。指定されたチェックポイント間隔で継続的なクエリを実行します。

availableNow

ブール値、オプション

Trueの場合、利用可能なすべてのデータを複数のバッチで処理してからクエリを終了します。

realTime

文字列、オプション

バッチ処理期間文字列(例: '5 seconds' )。指定された期間でバッチ処理によるリアルタイムモードのクエリを実行します。

戻り値

DataStreamWriter

Python
df = spark.readStream.format("rate").load()

5秒ごとに実行をトリガーする:

Python
df.writeStream.trigger(processingTime='5 seconds')
# <...streaming.readwriter.DataStreamWriter object ...>

5秒ごとに連続実行をトリガーする:

Python
df.writeStream.trigger(continuous='5 seconds')
# <...streaming.readwriter.DataStreamWriter object ...>

利用可能なすべてのデータを複数のバッチで処理する:

Python
df.writeStream.trigger(availableNow=True)
# <...streaming.readwriter.DataStreamWriter object ...>

5秒ごとにリアルタイム実行をトリガーする:

Python
df.writeStream.trigger(realTime='5 seconds')
# <...streaming.readwriter.DataStreamWriter object ...>
このページの見出し