Databricksアーキテクチャの概要

この記事では、AWSと組み合わせたエンタープライズアーキテクチャを含むDatabricksアーキテクチャの概要を説明します。

ハイレベルのアーキテクチャ

Databricks 、コントロール プレーンコンピュート プレーンから動作します。

  • コントロール プレーンには、Databricks アカウントで Databricks が管理するバックエンド サービスが含まれます。 Web アプリケーションはコントロール プレーンにあります。

  • コンピュートプレーンはデータが処理される場所です。 使用するコンピュートに応じて、2 種類のコンピュート プレーンがあります。

    • サーバレス コンピュートの場合、サーバレス コンピュート リソースは Databricksアカウントの サーバレス コンピュート プレーン で実行されます。

    • Databricksクラシック コンピュートの場合、コンピュートリソースは、AWS クラシック コンピュート プレーン と呼ばれる アカウントにあります。これは、AWS アカウント内のネットワークとそのリソースを指します。

次の図は、Databricks の全体的なアーキテクチャを示しています。

図: Databricks アーキテクチャ

サーバレスコンピュートプレーン

サーバーレス コンピュート プレーンでは、 Databricksコンピュート リソース はDatabricksアカウント内のコンピュート レイヤーで実行されます。 Databricks 、ワークスペースのクラシック コンピュート プレーンと同じAWSリージョンにサーバーレス コンピュート プレーンを作成します。

サーバーレス コンピュート プレーン内の顧客データを保護するために、サーバーレス コンピュート はワークスペースのネットワーク境界内で実行され、さまざまなセキュリティ レイヤーを使用して、同じ顧客のクラスター間で異なるDatabricksワークスペースと追加のネットワーク制御を分離します。

サーバレス コンピュート プレーンでのネットワークの詳細については、 「サーバレス コンピュート プレーンのネットワーク」を参照してください

クラシックコンピュートプレーン

従来のコンピュート プレーンでは、 DatabricksコンピュートリソースがAWSアカウントで実行されます。 顧客のAWSアカウント内の各ワークスペースの仮想ネットワーク内に新しいコンピュートリソースが作成されます。

従来のコンピュートプレーンは、各顧客独自のAWSアカウントで実行されるため、自然な分離が実現されます。 クラシック コンピュート プレーンでのネットワークの詳細については、 「クラシック コンピュート プレーンのネットワーク」を参照してください。

リージョンサポートについては、「Databricksのクラウドとリージョン」を参照してください。