オートスケール

備考

ベータ版

Lakebase Postgres (オートスケール Beta) は 次のリージョンで利用できます: us-east-1 、 us-west-2 、 eu-west-1 。

このベータリリースは Lakebase の次のバージョンであり、評価目的でのみ利用できます。本番運用ワークロードの場合は、 Lakebase Public Preview を使用します。どのバージョンが適しているかを判断するには、バージョンの選択を参照してください。

オートスケールは、現在のワークロードの需要に応じて、Lakebase コンピュートに割り当てられるコンピュートリソースの量を動的に調整します。アプリケーションでは 1 日を通してさまざまなレベルのアクティビティが発生するため、オートスケールは使用量のピーク時には自動的にコンピュート容量を増やし、静かな時間帯にはコンピュート容量を減らすため、手動介入の必要がなくなります。

この視覚化は、オフピーク時にリソースを節約しながら、データベースに必要なリソースを確実に確保するために、需要に基づいてコンピュートリソースをスケールアップまたはスケールダウンすることで、オートスケールが通常の 1 日を通してどのように機能するかを示しています。

オートスケールの可視化

オートスケールはユーザーが設定した範囲内で動作します。たとえば、コンピュートを 2 ～ 8 コンピュートユニット (CU) の間でスケールするように設定し、各 CU が 2 GB の RAM を提供する場合があります。コンピュートは、ワークロードに基づいてこれらの制限内で自動的に調整され、需要に関係なく、最小値を下回ったり、最大値を超えたりすることはありません。

注記

Lakebase パブリックプレビューとオートスケールベータ : Lakebase パブリックプレビューでは、各コンピュートユニットに約 16 GB の RAM が割り当てられました。 Lakebase オートスケール Beta では、各 CU に 2 GB の RAM が割り当てられます。この変更により、よりきめ細かいスケーリングオプションとコスト管理が可能になります。

オートスケールの仕組み

自動リソース調整

オートスケールを有効にしてコンピュートの最小サイズと最大サイズを設定すると、Lakebase はワークロードを継続的に監視し、リソースを自動的に調整します。システムは、スケーリングの決定を行うために 3 つの主要なメトリクスを追跡します。

CPU 負荷: プロセッサの使用率を監視して、データベースに十分な処理能力があることを確認します。
メモリ使用量: メモリ制限を防ぐために RAM の消費量を追跡します。
ワーキングセットサイズ: 頻繁にアクセスされるデータを推定し、キャッシュパフォーマンスを最適化します。

これらのメトリクスに基づいて、Lakebase は、設定された範囲内に留まりながら、需要が増加するとコンピュートをスケールアップし、アクティビティが減少するとスケールダウンします。

境界を拡大する

コンピュートの最小サイズと最大サイズを設定することで、スケーリング範囲を定義します。この範囲では以下が提供されます:

パフォーマンス保証: 最低限のパフォーマンスにより、アクティビティが低いときでもベースラインパフォーマンスが保証されます。
コスト管理: 最大値を設定することで、無制限のリソース消費とコストを防止します。
自動最適化: これらの境界内で、Lakebase がすべてのスケーリングの決定を処理します。

たとえば、2 ～ 8 CU (4 ～ 16 GB RAM) の範囲では、負荷に関係なく、コンピュートは需要に合わせて自動的にスケーリングされますが、8 CU を超えることはありません。

ダウンタイムや手動介入なし

オートスケールの調整は、コンピュートの再起動や接続の中断を必要とせずに行われます。一度構成すると、システムは自律的に動作し、インフラストラクチャの管理ではなくアプリケーションに集中できるようになります。

オートスケールのメリット

コスト効率: 実際に使用するコンピュートリソースに対してのみお支払いいただきます。オフピーク時にはコンピュートがスケールダウンされ、コストが削減されます。ピーク時には、パフォーマンスを維持するためにスケールアップします。

パフォーマンスの最適化: ワークロードが増加すると、データベースは自動的に追加のリソースを受け取り、トラフィックの急増や集中的な操作中のパフォーマンスの低下を防ぎます。

予測可能なコスト: コンピュートの最大サイズを設定することで、コンピュートコストの上限を制御し、リソースの暴走による予期せぬ出費を防ぎます。

簡素化された操作: オートスケールにより、ワークロードパターンを手動で監視してコンピュートサイズを調整する必要がなくなり、操作上のオーバーヘッドと人的エラーのリスクが軽減されます。

オートスケールの設定

オートスケール設定では、コンピュートサイズの最小値と最大値の境界を設定する必要があります。オートスケールはコンピュート32CUまで使用可能です。

オートスケールの有効化と構成の詳細な手順については、「コンピュートの管理」を参照してください。

一般的なオートスケールのシナリオ

AIエージェントとアプリケーションのワークロード

Databricks 上に構築された AI エージェントとインタラクティブアプリケーションでは、さまざまなリクエストパターンが発生することがよくあります。オートスケールにより、アクティブなユーザーセッション中のトラフィックの急増にデータベースが確実に対処できるようになり、静かな期間のコストが削減されます。

開発およびテスト環境

スキーマ変更のテストまたはデータパイプラインの検証のための開発ブランチでは、通常、断続的なアクティビティが発生します。オートスケールは、アクティブな開発中に適切なパフォーマンスを確保しながら、アイドル期間中のリソースを最小限に抑えます。

顧客向けダッシュボードとアプリケーション

アナリティクスや運用に関する知識をエンドユーザーに提供するアプリケーションには、多くの場合、時間帯に応じた使用パターンがあります。オートスケールは、1 日を通してユーザーのアクティビティに合わせてリソースを自動的に調整します。

オートスケールしてゼロにスケールする

オートスケールは、 scale to zeroと組み合わせて機能します。オートスケールはワークロードの需要に基づいてリソースを調整しますが、ゼロにスケールすると、一定期間非アクティブになった後にコンピュートが完全に一時停止され、アイドル期間中のコンピュートのコストがゼロに削減されます。

両方の機能を構成する場合:

アクティブ期間: オートスケールは、定義された範囲内のワークロードに基づいてコンピュートサイズを調整します。
非アクティブ期間: ゼロへのスケールタイムアウトの後、コンピュートは完全に一時停止します。
アクティビティの再開: 新しいクエリが到着すると、コンピュートは最小オートスケールサイズで再開します。

この組み合わせにより、特にアイドル期間が長くなる開発、テスト、ステージング環境においてコスト効率が最大化されます。

次のステップ

コンピュートを管理して、オートスケールを有効にして構成する方法を学びます
非アクティブ時にコンピュートがどのように一時停止できるかを理解するには、ゼロにスケールします。
分離されたデータベース環境の作成について学習するためのデータベースブランチ

オートスケールの仕組み​

自動リソース調整​

境界を拡大する​

ダウンタイムや手動介入なし​

オートスケールのメリット​

オートスケールの設定​

一般的なオートスケールのシナリオ​

AIエージェントとアプリケーションのワークロード​

開発およびテスト環境​

顧客向けダッシュボードとアプリケーション​

オートスケールしてゼロにスケールする​

次のステップ​