メインコンテンツまでスキップ

Configure ストリーミング データソース

Databricks は、ストリーム メッセージング サービスと統合して、 Databricks レイクハウスにほぼリアルタイム データ インジェストを行うことができます。 Databricks は、レイクハウス内のエンリッチメントおよび変換されたデータを他のストリーミングシステムと同期することもできます。

構造化ストリーミングは、 Apache Sparkでサポートされているファイル形式へのネイティブ ストリーミング アクセスを提供しますが、 Databricks では、クラウド オブジェクト ストレージからデータを読み取るほとんどの構造化ストリーミング操作に Auto Loader することをお勧めします。 「Auto Loaderとは」を参照してください。

ストリーミング メッセージを Delta Lake に取り込むと、メッセージを無期限に保持できるため、保持しきい値によるデータ損失を心配することなくデータ ストリームを再生できます。

メッセージキューからのストリーミングの特定の設定の詳細については、以下を参照してください。