メインコンテンツまでスキップ

Databricks アーキテクチャの概要

この記事では、AWSと組み合わせたエンタープライズアーキテクチャを含むDatabricksアーキテクチャの概要を説明します。

高レベルのアーキテクチャ

Databricks は、 コントロールプレーンコンピュートプレーン から動作します。

  • コントロールプレーン には、DatabricksアカウントでDatabricksが管理するバックエンドサービスが含まれます。 Webアプリケーションはコントロールプレーンにあります。

  • コンピュートプレーン は、データが処理される場所です。 使用するコンピュートに応じた2 種類のコンピュートプレーンが存在します。

    • サーバレスコンピュートの場合、サーバレスコンピュートリソースはDatabricksアカウントの サーバレスコンピュートプレーン で実行されます。
    • Databricksクラシックコンピュートの場合、コンピュートリソースは、AWS クラシック コンピュート プレーンと呼ばれるアカウントに存在します。これは、AWS アカウント内のネットワークとそのリソースを指します。

    クラシック コンピュートとサーバレス コンピュートの詳細については、 コンピュートの種類を参照してください。

各 Databricks ワークスペースには、 ワークスペース ストレージ バケット と呼ばれるストレージ バケットが関連付けられています。 ワークスペースストレージバケットは AWS アカウントにあります。

次の図は、Databricks の全体的なアーキテクチャを示しています。

図: Databricks のアーキテクチャ

サーバレス コンピュート plane

サーバレス コンピュート プレーンにおいては、Databricks アカウント内のコンピュート レイヤーでDatabricksコンピュート リソースが実行されます。Databricksは、ワークスペースの従来のコンピュートプレーンと同じ AWS リージョンにサーバレス コンピュートプレーンを作成します。 このリージョンは、ワークスペースの作成時に選択します。

サーバーレスコンピュートプレーン内の顧客データを保護するために、サーバーレスコンピュートはワークスペースのネットワーク境界内で実行され、さまざまなセキュリティレイヤーを使用して、同じ顧客のクラスター間で異なるDatabricksワークスペースと追加のネットワーク制御を分離します。

サーバレス コンピュート プレーンのネットワーキングの詳細については、 サーバレス コンピュート プレーン ネットワーキングを参照してください。

クラシックコンピュートプレーン

従来のコンピュートプレーンでは、あなたのAWS アカウントでDatabricksコンピュート リソースを実行します 。新しいコンピュート リソースは、各ワークスペースの仮想ネットワーク内の顧客の AWS アカウント内に作成されます。

従来のコンピュート プレーンは、各顧客自身の AWS アカウントで実行されるため、自然に分離されています。 クラシック コンピュート プレーンでのネットワークの詳細については、「 クラシック コンピュート プレーン ネットワーク」を参照してください

リージョンのサポートについては、「 Databricks のクラウドとリージョン」を参照してください

ワークスペース ストレージ バケット

ワークスペースを作成するときは、ワークスペースストレージバケットとして使用する S3 バケットとプレフィックスを指定します。

ワークスペースのストレージバケットには、次のものが含まれています。

  • ワークスペース システム データ: ワークスペース システム データは、ノートブックの作成など、さまざまな Databricks 機能を使用すると生成されます。 このバケットには、ノートブックのリビジョン、ジョブ実行の詳細、コマンド結果、Spark ログが含まれます
  • DBFS: DBFS(Databricks File System)は、 dbfs:/ ネームスペースでアクセス可能なDatabricks環境の分散ファイルシステムです。 DBFSルート マウントと DBFS マウントはどちらも dbfs:/ 名前空間にあります。 DBFSルート マウントまたは DBFS マウントを使用したデータの格納とアクセスは非推奨のパターンであり、Databricksでは推奨されません。詳細については、DBFSとはを参照してください。
  • Unity Catalogワークスペースカタログ: ワークスペースが自動的にUnity Catalog有効になっている場合、ワークスペースストレージバケットにはデフォルト ワークスペースカタログが含まれています。ワークスペース内のすべてのユーザーは、このカタログのデフォルトスキーマにアセットを作成できます。 Unity Catalog の設定と管理を参照してください。