Databricksアーキテクチャの概要

この記事では、AWSと組み合わせたエンタープライズアーキテクチャを含むDatabricksアーキテクチャの概要を説明します。

ハイレベルのアーキテクチャ

Databricks は、コントロールプレーンコンピュートプレーンから動作します。

  • コントロールプレーンには、DatabricksアカウントでDatabricksが管理するバックエンドサービスが含まれます。 Webアプリケーションはコントロールプレーンにあります。

  • コンピュートプレーンは、データが処理される場所です。 使用するコンピュートに応じた2 種類のコンピュートプレーンが存在します。

    • サーバレスコンピュートの場合、サーバレスコンピュートリソースはDatabricksアカウントの サーバレスコンピュートプレーンで実行されます。

    • Databricksクラシックコンピュートの場合、コンピュートリソースは、AWS クラシック コンピュート プレーンと呼ばれるアカウントに存在します。これは、AWS アカウント内のネットワークとそのリソースを指します。

次の図は、Databricks の全体的なアーキテクチャを示しています。

図: Databricks アーキテクチャ

サーバレスコンピュートプレーン

サーバーレスコンピュートプレーンでは、 DatabricksコンピュートリソースはDatabricksアカウント内のコンピュートレイヤーで実行されます。 Databricksは、サーバーレスコンピュートプレーンをワークスペースのクラシックコンピュートプレーンと同じAWSリージョンに作成します。

サーバーレスコンピュートプレーン内の顧客データを保護するために、サーバーレスコンピュートはワークスペースのネットワーク境界内で実行され、さまざまなセキュリティレイヤーを使用して、同じ顧客のクラスター間で異なるDatabricksワークスペースと追加のネットワーク制御を分離します。

サーバレスコンピュートプレーンでのネットワークの詳細については、 「サーバレスコンピュートプレーンのネットワーク」を参照してください

クラシックコンピュートプレーン

クラシックコンピュートプレーンでは、 DatabricksコンピュートリソースがAWSアカウントで実行されます。 顧客のAWSアカウント内の各ワークスペースの仮想ネットワーク内に新しいコンピュートリソースが作成されます。

クラシックコンピュートプレーンは、各カスタマー独自のAWSアカウントで実行されるため、自然な分離が実現されます。 クラシックコンピュートプレーンにおけるネットワークの詳細については、「クラシックコンピュートプレーンのネットワーク」を参照してください。

リージョンサポートについては、「Databricksのクラウドとリージョン」を参照してください。