Databricks レイクハウスにデータを取り込む
Databricks は、Delta Lake がサポートするレイクハウスにさまざまなソースからデータを取り込むさまざまな方法を提供します。 この記事では、データソースの一覧と、各ソース タイプからデータを取り込むためのステップ へのリンクを提供します。
クラウドオブジェクトストレージ
クラウド・オブジェクト・ストレージからの増分インジェストを構成する方法については、 クラウド・オブジェクト・ストレージからのデータのインジェストを参照してください。
LakeFlowコネクト
Databricks LakeFlow Connect は、エンタープライズ アプリケーションおよびデータベースからの取り込み用のネイティブ コネクタを提供します。 結果として得られる取り込みパイプラインはUnity Catalogによって管理され、サーバレス コンピュートとDelta Live Tablesによって強化されます。
LakeFlow Connect は、効率的な増分読み取りと書き込みを活用して、データの取り込みをより高速かつスケーラブルに、そしてコスト効率よく行うと同時に、データを下流での使用に備えて最新の状態に維持します。
ストリーミングソース
Databricks は、ストリーム メッセージング サービスと統合して、リアルタイムに近いデータ をレイクハウスに取り込むことができます。 ストリーミングと増分インジェストを参照してください。
ローカル・データ・ファイル
ローカル データ ファイルを安全にアップロードしたり、公開 URL からファイルをダウンロードしたりできます。 「Databricks へのファイルのアップロード」を参照してください。
Delta Lakeへのデータの移行
既存のデータを Delta Lake に移行する方法については、Delta Lake へのデータの移行を参照してください。