ストリーミング データソースの構成

Databricks は、Databricks レイクハウスへの直近のデータ取り込みのためにストリーム メッセージング サービスと統合できます。 Databricks は、レイクハウス内の強化および変換されたデータを他のストリーミング システムと同期することもできます。

構造化ストリーミングは、Apache Spark でサポートされているファイル形式へのネイティブ ストリーミング アクセスを提供しますが、Databricks では、クラウド オブジェクト ストレージからデータを読み取るほとんどの構造化ストリーミング操作で Auto Loader をお勧めします。 「Auto Loaderとは」を参照してください。

ストリーミング メッセージを Delta Lake に取り込むと、メッセージを無期限に保持できるため、保持しきい値によるデータ損失を恐れることなくデータ ストリームを再生できます。

メッセージ キューからのストリーミングの特定の構成の詳細については、以下を参照してください。