メインコンテンツまでスキップ

データベースインスタンスへのアクセスと操作

備考

プレビュー

この機能は、us-east-1us-west-2eu-west-1ap-southeast-1ap-southeast-2eu-central-1us-east-2ap-south-1の各地域でパブリック プレビュー段階です。

このページでは、Lakebaseデータベースインスタンスを操作するさまざまな方法の概要を説明し、PostgreSQLクエリを最適化する方法を推奨します。

データベースへのアクセス方法

データベースインスタンスにアクセスして PostgreSQL クエリを実行し、ID を管理するための次の方法を次に示します。マネージド Postgres サービスとして、機能にはいくつかの制限があります。Postgres の互換性を参照してください。

手法

説明

SQLエディタ

Databricks SQL エディターからデータベースに接続し、クエリを実行します。

Databricksノートブック

Databricks ノートブックからデータベースに接続し、データベースからクエリを実行します。

SQL クライアント

psql、DBeaver、pgAdmin などの外部ツールからデータベースに接続し、データベースからクエリを実行します。

Databricks SQL エンドポイントを介してクエリを実行する場合、クエリはデータベース インスタンスにフェデレーションされます。

クエリの最適化

pg_stat_statements 拡張機能は、クエリのパフォーマンスに関する詳細情報を提供し、低速のクエリを特定して最適化するのに役立ちます。

ユーザーは、クエリのクエリ テキストと、権限を継承するロールを表示できます。ロールに対する ADMIN 権限があり、そのロールのクエリテキストが表示されない場合は、そのロールのメンバーシップを自分自身に付与します。ロールに対する権限がない場合、セキュリティ上の理由から、そのクエリ テキストを表示することはできません。

Unity CatalogテーブルをPostgresに同期する

Unity Catalog テーブルを Postgres に同期すると、待機時間の短い読み取りクエリが可能になり、他の Postgres テーブルとのクエリ時の結合がサポートされます。

Unity CatalogテーブルをPostgresに同期する図

主な考慮事項:

  • データの鮮度: Continuous Sync Mode は、 Unity Catalog マネージドテーブルから同期テーブルにデータを最小 15 秒間隔で更新します。
  • 更新レート: 同期パイプラインは、キャパシティーユニット (CU) あたり約 1,200 行/秒の連続書き込みと、CU あたり最大 15,000 行/秒の一括書き込みをサポートします。
  • テーブル サイズの制限: 同期される各テーブルは最大 2 TB です。完全なテーブル再作成の代わりに更新が必要な場合、制限は 1 TB です。

DBSQL による横串検索の使用

DBSQLを介した横串検索を使用して、データを同期せずにPostgresテーブルをクエリします。

横串検索を使用して Postgres テーブルをクエリする図

主な考慮事項:

  • レイテンシー: 横串検索は、PostgreSQL の直接クエリよりも待ち時間が長くなります。
  • スループット: Databricks SQL は、PostgreSQL に直接クエリを実行する場合と比較して、1 秒あたりのクエリ数 (QPS) を低く抑えます。
  • クエリの最適化: 最適なパフォーマンスを得るには、Postgres テーブルの主キーまたはインデックス付き列でフィルタリングするクエリを記述します。