メインコンテンツまでスキップ

Databricks アーキテクチャの概要

この記事では、AWSと組み合わせたエンタープライズアーキテクチャを含むDatabricksアーキテクチャの概要を説明します。

高レベルのアーキテクチャ

Databricks は、 コントロールプレーンコンピュートプレーン から動作します。

  • コントロールプレーン には、DatabricksアカウントでDatabricksが管理するバックエンドサービスが含まれます。 Webアプリケーションはコントロールプレーンにあります。

  • コンピュートプレーン は、データが処理される場所です。 使用するコンピュートに応じた2 種類のコンピュートプレーンが存在します。

    • サーバレスコンピュートの場合、サーバレスコンピュートリソースはDatabricksアカウントの サーバレスコンピュートプレーン で実行されます。
    • Databricksクラシックコンピュートの場合、コンピュートリソースは、AWS クラシック コンピュート プレーンと呼ばれるアカウントに存在します。これは、AWS アカウント内のネットワークとそのリソースを指します。

    クラシック コンピュートとサーバレス コンピュートの詳細については、 コンピュートの種類を参照してください。

各 Databricks ワークスペースには、 ワークスペース ストレージ バケット と呼ばれるストレージ バケットが関連付けられています。 ワークスペースストレージバケットは AWS アカウントにあります。

次の図は、Databricks の全体的なアーキテクチャを示しています。

図: Databricks のアーキテクチャ

サーバレス コンピュート plane

サーバレス コンピュート プレーンで、Databricks アカウント内のコンピュート レイヤーでコンピュート リソースDatabricks実行します。Databricks 、ワークスペースの従来のコンピュート平面と同じ AWS 領域にサーバレス コンピュート平面を作成します。 このリージョンは、ワークスペースの作成時に選択します。

サーバーレスコンピュートプレーン内の顧客データを保護するために、サーバーレスコンピュートはワークスペースのネットワーク境界内で実行され、さまざまなセキュリティレイヤーを使用して、同じ顧客のクラスター間で異なるDatabricksワークスペースと追加のネットワーク制御を分離します。

サーバレス コンピュート プレーンのネットワーキングの詳細については、 サーバレス コンピュート プレーン ネットワーキングを参照してください。

クラシックコンピュートプレーン

クラシックコンピュートプレーンでは、 DatabricksコンピュートリソースがAWSアカウントで実行されます。 顧客のAWSアカウント内の各ワークスペースの仮想ネットワーク内に新しいコンピュートリソースが作成されます。

従来のコンピュート プレーンは、各顧客自身の AWS アカウントで実行されるため、自然に分離されています。 クラシック コンピュート プレーンでのネットワークの詳細については、「 クラシック コンピュート プレーン ネットワーク」を参照してください

リージョンのサポートについては、「 Databricks のクラウドとリージョン」を参照してください

ワークスペース ストレージ バケット

ワークスペースを作成するときは、ワークスペースストレージバケットとして使用する S3 バケットとプレフィックスを指定します。

ワークスペースのストレージバケットには、次のものが含まれています。

  • ワークスペース システム データ: ワークスペース システム データは、ノートブックの作成など、さまざまな Databricks 機能を使用すると生成されます。 このバケットには、ノートブックのリビジョン、ジョブ実行の詳細、コマンド結果、Spark ログが含まれます
  • DBFS: DBFS(Databricks File System)は、 dbfs:/ ネームスペースでアクセス可能なDatabricks環境の分散ファイルシステムです。 DBFSルート マウントと DBFS マウントはどちらも dbfs:/ 名前空間にあります。 DBFSルート マウントまたは DBFS マウントを使用したデータの格納とアクセスは非推奨のパターンであり、Databricksでは推奨されません。詳細については、「DBFSとは」を参照してください。
  • Unity Catalogワークスペースカタログ: ワークスペースが自動的にUnity Catalog有効になっている場合、ワークスペースストレージバケットにはデフォルト ワークスペースカタログが含まれています。ワークスペース内のすべてのユーザーは、このカタログのデフォルトスキーマにアセットを作成できます。 「Unity Catalog の設定と管理」を参照してください。