Databricksアーキテクチャの概要
この記事では、AWSと組み合わせたエンタープライズアーキテクチャを含むDatabricksアーキテクチャの概要を説明します。
ハイレベルのアーキテクチャ
Databricks 、コントロール プレーンとコンピュート プレーンから動作します。
コントロール プレーンには、Databricks アカウントで Databricks が管理するバックエンド サービスが含まれます。 Web アプリケーションはコントロール プレーンにあります。
コンピュートプレーンはデータが処理される場所です。 使用するコンピュートに応じて、2 種類のコンピュート プレーンがあります。
サーバレス コンピュートの場合、サーバレス コンピュート リソースは Databricksアカウントの サーバレス コンピュート プレーン で実行されます。
Databricksクラシック コンピュートの場合、コンピュートリソースは、AWS クラシック コンピュート プレーン と呼ばれる アカウントにあります。これは、AWS アカウント内のネットワークとそのリソースを指します。
次の図は、Databricks の全体的なアーキテクチャを示しています。
サーバレスコンピュートプレーン
サーバーレス コンピュート プレーンでは、 Databricksコンピュート リソース はDatabricksアカウント内のコンピュート レイヤーで実行されます。 Databricks 、ワークスペースのクラシック コンピュート プレーンと同じAWSリージョンにサーバーレス コンピュート プレーンを作成します。
サーバーレス コンピュート プレーン内の顧客データを保護するために、サーバーレス コンピュート はワークスペースのネットワーク境界内で実行され、さまざまなセキュリティ レイヤーを使用して、同じ顧客のクラスター間で異なるDatabricksワークスペースと追加のネットワーク制御を分離します。
サーバレス コンピュート プレーンでのネットワークの詳細については、 「サーバレス コンピュート プレーンのネットワーク」を参照してください。
クラシックコンピュートプレーン
従来のコンピュート プレーンでは、 DatabricksコンピュートリソースがAWSアカウントで実行されます。 顧客のAWSアカウント内の各ワークスペースの仮想ネットワーク内に新しいコンピュートリソースが作成されます。
従来のコンピュートプレーンは、各顧客独自のAWSアカウントで実行されるため、自然な分離が実現されます。 クラシック コンピュート プレーンでのネットワークの詳細については、 「クラシック コンピュート プレーンのネットワーク」を参照してください。
リージョンサポートについては、「Databricksのクラウドとリージョン」を参照してください。