メインコンテンツまでスキップ

ユースケース

Lakebaseオートスケールは、Postgres でのレイクハウス データの提供レイクハウスでの Postgres の変更の保存アプリケーション バックエンドの実行、およびAIエージェントとMLの強化の 4 つの主なパターンをサポートしています。 各パターンは、PostgresとUnity Catalogを併用することで、アプリケーションに低遅延のデータベースを提供し、レイクハウスと常に同期を保ちます。

レイクハウスデータの提供

レイクハウスの行がLakebase Postgres に同期され、低レイテンシーのアプリ読み取りが実現

同期されたテーブルは、Unity CatalogのデータをLakebaseデータベースに取り込み、低遅延のトランザクション読み取りを実現します。ソース テーブルを選択し、同期モードを選択すると、パイプラインはフルマネージドになります。 同期スクリプトも、外部オーケストレーションも、監視対象のジョブもありません。連続モードでは、データソースから数秒以内の精度でデータを保持します。トリガーモードは、定期的な増分更新によって鮮度とコストのバランスを取ります。アプリケーションは常に、独自の運用データとともに最新のアナリティクスを提供します。

最初のステップ

学習パス

  1. 同期テーブルを作成する
  2. 定期的な同期をスケジュールする
  1. 同期モード— スナップショット、トリガー、または連続
  2. データ型マッピング— UCとPostgresの型互換性
  3. 容量計画— 接続制限、スループット率
  4. Unity Catalogに登録する— 運用データと分析データにわたるクロスソース クエリ

Postgres の変更をレイクハウスに保存する

注記

Lakebase変更データフィード機能はパブリック プレビュー段階にあります。

同じ行がPostgresからDeltaに完全な変更履歴とともに複製されます

Lakebaseデータフィード (CDF) は、Postgres テーブルからの行レベルの変更をUnity Catalogで管理されるDeltaテーブルとして保存します。 挿入、更新、削除のすべては、ライトアヘッドログから取得され、 Delta履歴テーブルに新しい行として書き込まれます。 外部CDCツール、 Sparkジョブ、パイプラインを維持する必要はありません。 キャプチャ パスは独立したコンピュートで実行されるため、本番運用クエリは影響を受けません。 履歴テーブルはDeltaチェンジデータフィードと同じ形状をしているため、ダウンストリームのパイプライン、マテリアライズドビュー、および監査クエリが直接接続されます。

最初のステップ

学習パス

  1. Postgres の変更をレイクハウスに保存する
  2. 下流パイプラインを構築する
  1. Lakebase CDFとは? — 宛先スキーマ、システム列、変更パターン
  2. データ型マッピング— PostgresからDelta型への対応
  3. スキーマ変更の管理― スキーマが進化するとどうなるか
  4. 制限事項— 障害発生シナリオとトラブルシューティング

アプリケーションバックエンド

標準のPostgresクライアントはLakebase Postgresに接続します

アプリケーションは、他のPostgresデータベースに接続するのと同じ方法でLakebaseに接続します。既に使い慣れているドライバーやフレームワークを使用してください。アプリのトラフィックが急増した場合、オートスケールは接続を切断せずにコンピュートを追加します。 トラフィックが停止すると、スケール・トゥ・ゼロ機能はデータベースを一時停止し、次のクエリが呼び出された際に数百ミリ秒以内に再アクティブ化します。ピーク時にプロビジョニングを行う必要はなく、アイドル状態に対して料金を支払う必要はありません。 開発においては、ブランチングによって、各開発者はデータシード、ストレージの重複、待ち時間なしに、本番運用データベースの独立したコピーを利用できるようになります。

最初のステップ

学習パス

  1. Databricksアプリの構築— 管理された認証情報を使用してテンプレートをデプロイする
  2. 独自のアプリケーション(カスタムDatabricksアプリ、SDK、またはAPI)を接続します。
  1. オートスケールの仕組み— 負荷時のコンピュート動作
  2. ゼロにスケールする— 停止、再アクティブ化、アイドルタイムアウト
  3. ブランチの仕組み― 開発/テスト環境におけるコピーオンライト分離
  4. 認証— 本番運用アプリのローテーション

AIエージェントとML

エージェントはメモリを保存し、モデルはレイクハウスと同期されたLakebase Postgres を通じて機能を読み取ります。

Lakebase 、 AIエージェント メモリとFeature Servingのバックエンドとして機能します。 LangGraphまたはOpenAI Agents SDKを使用して構築されたエージェントは、会話の状態と長期記憶をPostgresに保存します。Mosaic AIで提供されるモデルは、 Lakebaseオートスケールを利用したオンライン フィーチャ ストアを通じてフィーチャ データにアクセスします。 どちらも、自動スケーリング、スケール・トゥ・ゼロ、およびUnity Catalogガバナンスの恩恵を受ける。

最初のステップ

学習パス

  1. Databricks Apps にエージェントをデプロイする— テンプレートを複製してデプロイする
  2. エージェントの状態とメモリ— Lakebaseで短期記憶と長期記憶を追加する
  1. アプリ上のステートフルエージェント— LangGraph チェックポインタ、メモリテンプレート
  2. モデルサービング上のステートフルエージェント― タイムトラベル、チェックポイント管理
  3. Feature Storeとモデルサービング- Lakebaseを活用した低レイテンシのフィーチャー データ
  4. オンラインフィーチャーストア— フィーチャーストアの作成、公開、管理