メインコンテンツまでスキップ

データベースプロジェクトの管理

備考

ベータ版

Lakebase Postgres (オートスケール Beta) は、 Lakebase の次のバージョンであり、評価のみに利用できます。 本番運用ワークロードの場合は、 Lakebase Public Previewを使用します。 どのバージョンが適しているかを判断するには、バージョンの選択を参照してください。

データベース プロジェクトは、ブランチ、コンピュート、データベース、ロールを含む、Lakebase リソースの最上位のコンテナーです。 このページでは、プロジェクトを作成し、その構造を理解し、設定を構成し、ライフサイクルを管理する方法について説明します。

Lakebase を初めて使用する場合は、 「はじめに」から始めて最初のプロジェクトを作成してください。

データベースプロジェクトの構造

Lakebase プロジェクト構造を理解すると、リソースを効果的に整理および管理できるようになります。データベース プロジェクトは、データベース、ブランチ、コンピュート、および関連リソースの最上位のコンテナです。 各プロジェクトには、コンピュート安全、復元ウィンドウ、およびプロジェクト内のすべてのブランチに適用される更新の設定が含まれています。

最上位レベルでは、プロジェクトには 1 つ以上のブランチが含まれます。プロジェクト内では、開発、テスト、ステージング、本番運用などのさまざまな環境のブランチを作成できます。 各ブランチには、独自のコンピュート、ロール、データベースが含まれています。

Project
└── Branches (production, development, etc.)
├── Computes (R/W compute)
├── Roles (Postgres roles)
└── Databases (Postgres databases)

支店

データはブランチに存在します。各 Lakebase プロジェクトは、削除できないproductionというルート ブランチを使用して作成されます。追加のブランチを作成し、別のブランチをデフォルト ブランチとして指定することはできますが、ルート ブランチを削除することはできません。

プロジェクト内の任意のブランチから子ブランチを作成できます。子ブランチを作成すると、作成時に親ブランチからすべてのデータベース、ロール、およびデータが継承されます。親ブランチでの後続の変更は子ブランチに自動的には伝播されないため、分離された開発、テスト、または実験が可能になります。

各ブランチには複数のデータベースとロールを含めることができます。詳細:ブランチの管理

コンピュート

コンピュートは、Postgres を実行するための vCPU とメモリを含む仮想化コンピューティング リソースです。 プロジェクトを作成すると、プロジェクトの当然のブランチに対してプライマリ R/W (読み取り/書き込み) コンピュートが作成されます。 各ブランチには単一のプライマリ R/W コンピュートがあります。 ブランチ上にあるデータベースに接続するには、ブランチに関連付けられた R/W コンピュートを通じて接続する必要があります。

プライマリ R/W コンピュートに加えて、1 つ以上のリード レプリカ (読み取り専用) コンピュートを任意のブランチに追加できます。 リードレプリカを使用すると、水平読み取りスケーリング、アナリティクスとレポート クエリ、ユーザーまたはアプリケーションの読み取り専用アクセスなどのユースケースのために、プライマリ コンピュートから読み取り専用ワークロードをオフロードできます。 詳細:コンピュートの管理リードレプリカ

役割

ロールは Postgres ロールです。データベースを作成してアクセスするには、ロールが必要です。ロールはブランチに属します。プロジェクトを作成すると、デフォルトdatabricks_postgresデータベースの所有者であるDatabricks ID (たとえば、 user@databricks.com ) に対して Postgres ロールが自動的に作成されます。 Lakebase UI で作成されたロールはすべてdatabricks_superuser権限で作成されます。ブランチごとに 500 ロールの制限があります。詳細:役割の管理

データベース

データベースは、スキーマ、テーブル、ビュー、関数、インデックスなどの SQL オブジェクトのコンテナーです。Lakebase では、データベースはブランチに属します。プロジェクトのデフォルト ブランチは、 databricks_postgresという名前のデータベースを使用して作成されます。ブランチごとに 500 個のデータベースの制限があります。詳細:データベースの管理

スキーマ

Lakebase 内のすべてのデータベースはpublicスキーマを使用して作成されます。これは、標準の Postgres インスタンスのデフォルトの動作です。デフォルトでは、SQL オブジェクトはpublicスキーマに作成されます。

プロジェクトの制限

Lakebase Postgres は、データベース プロジェクトに対して次の制限を適用します。

リソース

上限

同時にアクティブなコンピュートの最大数

5

プロジェクトあたりのブランチの最大数

500

ブランチあたりの Postgres ロールの最大数

500

ブランチあたりの Postgres データベースの最大数

500

ブランチあたりの最大論理データサイズ

8TB

ワークスペースあたりのプロジェクトの最大数

1000

保護されたブランチの最大数

5

ルートブランチの最大数

5

スナップショットの最大数

10

最大履歴保存期間

35日間

ゼロ時間までの最小スケール

60秒

同時アクティブコンピュート制限

同時にアクティブなコンピュートの制限は、リソースの枯渇を防ぐために同時に実行できるコンピュートの数を制限します。 この制限により、多くのコンピュート エンドポイントを一度に開始するなど、偶発的なリソース サージが防止されます。 安全な制限は、プロジェクトごとに同時にアクティブなコンピュートが 5 つです。

重要: デフォルト ブランチはこの制限から除外されるため、常に利用可能になります。

制限を超えると、制限を超えた追加のコンピュートは停止状態となり、接続しようとするとエラーが表示されます。 これを解決するには:

  1. 他のアクティブなコンピュートを一時停止して、再試行してください。
  2. このエラーが頻繁に発生する場合は、Databricks サポートに連絡して制限の引き上げをリクエストしてください。
注記

ゼロへのスケールを有効にしたコンピュートは、非アクティブな期間が続くと自動的にサスペンドされ、同時アクティブなコンピュートの制限内に留まることができます。

可用性

クラウドの可用性

Lakebase Postgres (ベータ版) は現在 AWS でのみ利用可能です。

利用可能な地域

Lakebase Postgres (ベータ版) は、次の AWS リージョンで利用できます。

  • us-east-1 (米国東部 - バージニア州北部)
  • us-west-2 (米国西部 - オレゴン州)
  • eu-west-1 (ヨーロッパ - アイルランド)

Lakebase プロジェクトは、Databricks ワークスペース リージョンに作成されます。

Postgresのバージョンサポート

Lakebase Postgres (オートスケール Beta) は Postgres 16 と Postgres 17 をサポートします。

データベースプロジェクトを作成する

Lakebase Postgres で複数のデータベース プロジェクトを作成して、アプリケーションまたは顧客を完全に分離し、データとリソースを明確に分離することができます。

データベース プロジェクトを作成するには:

  1. 右上隅のアプリスイッチャーをクリックして、Lakebase アプリを開きます。
  2. [新しいプロジェクト] をクリックします。
  3. プロジェクト設定を構成します。
    • プロジェクト名 : プロジェクトのわかりやすい名前を入力します。一般的な命名パターンには、アプリケーション (例: my-analytics-app ) やプロジェクトがサービスを提供する顧客またはテナント (例: acme-corp-db ) にちなんだ命名が含まれます。
    • Postgres バージョン : 使用する Postgres バージョンを選択します。

プロジェクトの作成 ダイアログには、プロジェクトの構成オプションが表示されます。

プロジェクト作成ダイアログ

Lakebase プロジェクトの リージョン は Databricks ワークスペース リージョンに設定されており、変更することはできません。

新しいプロジェクトには、デフォルトで次のリソースが含まれます。

  • 2 つのブランチ: production (メイン ブランチ) とdevelopment (子ブランチ)

  • 単一のプライマリ読み取り/書き込みコンピュートは、次の確実な設定で各ブランチに関連付けられています。

    ブランチ

    コンピュート単位 (CU)

    ラム

    オートスケール

    スケールゼロ

    production

    8 - 32 CU

    16~64GB

    有効

    無効化済み

    development

    2~4立方メートル

    4~8GB

    有効

    有効

  • Postgres データベース (名前: databricks_postgres )

  • Databricks ID の Postgres ロール (例: user@databricks.com )

既存のプロジェクトのコンピュート設定を変更するには、 「プロジェクト設定を構成する」を参照してください。 新しいプロジェクトの安全コンピュート設定を変更するには、 「プロジェクト設定を構成する」 の「安全 コンピュート」 を参照してください。

プロジェクト設定を構成する

プロジェクトを作成した後、プロジェクトダッシュボードの 「設定」 に移動してさまざまな設定を変更できます。

一般設定

プロジェクト名を更新できます。プロジェクト ID は変更できません。

プロジェクト名とIDの設定

コンピュート安心

次のようなプライマリ コンピュートの初期設定を設定します。

  • コンピュート サイズ (コンピュート単位で測定)
  • タイムアウトをゼロにスケールする(デフォルトは5分)

これらの設定は、新しいプライマリ コンピュートを作成するときに使用されます。

注記

既存のコンピュートの設定を変更するには、 「コンピュートの管理」を参照してください。

Lakebase Postgres は、0.5 CU から 32 CU までのコンピュート サイズをサポートします (0.5 から整数増分: 1、2、3... 16、次に 24、28、32)。 各コンピュート ユニット (CU) は 2 GB の RAM を提供します。

注記

Lakebase パブリック プレビューとオートスケール ベータ : Lakebase パブリック プレビューでは、各コンピュート ユニットに約 16 GB の RAM が割り当てられました。 Lakebase オートスケール Beta では、各 CU に 2 GB の RAM が割り当てられます。 この変更により、よりきめ細かいスケーリング オプションとコスト管理が可能になります。

代表的なサイズ:

コンピュート単位

ラム

0.5 CU

1 GB

1 CU

2 GB

4 CU

8GB

16 CU

32GB

32 CU

64GB

  • オートスケールを有効にするには、スライダーを使用してコンピュートのサイズ範囲を設定します。 オートスケールは、ワークロードの需要に基づいてコンピュート リソースを動的に調整します。 詳細はこちら:オートスケール
  • ゼロへのスケール設定を調整して、コンピュートが一時停止するまでの非アクティブなコンピュート時間を増減します。 常にアクティブなコンピュートの ゼロへのスケール を無効にすることもできます。 詳細:ゼロスケール

コンピュート安心設定

即時復元

プロジェクトの復元ウィンドウの長さを設定します。安心により、Lakebase はプロジェクト内のすべてのブランチの変更履歴を保持し、失われたデータを回復するためのポイントインタイム復元、データの問題を調査するためのタイムトラベル クエリ、開発ワークフローのための過去の状態からのブランチを可能にします。

復元ウィンドウは 2 日から 35 日まで設定できます。ご了承ください:

  • 復元ウィンドウを延長するとストレージ容量が増加する
  • 復元ウィンドウの設定はプロジェクト内のすべてのブランチに影響します

インスタントリストア設定

アップデート

Lakebase コンピュートおよび Postgres インスタンスを最新の状態に保つために、Lakebase は、Postgres のマイナー バージョンのアップグレード、セキュリティ パッチ、プラットフォーム機能を含むスケジュールされた更新を自動的に適用します。 更新はプロジェクト内のコンピュートに適用され、数秒しかかからない簡単なコンピュートの再起動が必要になります。

更新は自動的に適用されますが、更新の希望日時を設定することもできます。再起動は選択した時間枠内で行われます。

アップデートに関する詳細情報については、 「アップデート」を参照してください。

設定を更新します

プロジェクトを削除する

プロジェクトの削除は永続的なアクションであり、プロジェクトに属するコンピュート、ブランチ、データベース、ロール、およびデータも削除されます。

important

この操作は元に戻せません。データベース プロジェクトを削除すると、関連付けられているすべてのブランチとデータが削除されるため、注意してください。

削除する前に

Databricks では、データベース プロジェクトを削除する前に、関連付けられているすべての Unity Catalog カタログと同期されたテーブルを削除することをお勧めします。そうでない場合、カタログを表示したり、カタログを参照する SQL クエリを実行しようとするとエラーが発生します。

テーブルまたはカタログの所有者でない場合は、削除する前に所有権を自分に再割り当てする必要があります。

注記

Lakebase オートスケール Beta では、データベース プロジェクトが作成されたワークスペースにアクセスできるDatabricks ID はデータベース プロジェクトを削除できます。

プロジェクトを削除する

プロジェクトを削除するには:

  1. Lakebase アプリでデータベース プロジェクトの 設定 に移動します。
  2. プロジェクトの削除」 セクションで、 「削除」 をクリックし、プロジェクト名を入力して削除を確認します。