Databricks Geos: データ所在地

この記事では、指定サービスと呼ばれる顧客コンテンツ機能を処理するときに、Databricks Geos がデータの保存場所を管理する方法について説明します。

Databricks は、顧客コンテンツを処理する際にデータ所在地をどのように管理しますか?

従来の(Classic とサーバレスの両方の) Databricksアーキテクチャには、リージョンごとに提供される「コンピュート プレーン」と「コントロール プレーン」があります。

指定サービス(AIワークロードを強化するサービスを含む)は、Geo ベースで利用できます。 指定サービスは常に顧客に代わって Databricks によって管理されます。

顧客コンテンツは、ワークスペースと同じ Geo でのみ処理されます。

Databricks Geo とは何ですか?

Geo は、データが処理される場所に関して顧客に予測可能性と透明性を提供するためにDatabricksがまとめたデータセンター リージョンのグループです。

Geo を使用する指定サービスの場合、Databricks はワークスペースと同じ Geo 内のデータのみを処理します。

次の表は、利用可能な Databricks Geo とそれに含まれるリージョンを示しています。

Databricks Geo

次の地域で構成されています。

南北アメリカ

  • アメリカ合衆国

  • ブラジル

  • カナダ

アジア

  • 香港

  • 日本

  • 韓国

  • シンガポール

オーストラリアとニュージーランド

  • オーストラリア

  • ニュージーランド

ヨーロッパ

  • 欧州経済領域 (EEA)

  • スイス

  • 英国

インド

  • インド

中国本土

  • 中国本土

中東・アフリカ

  • カタール

  • 南アフリカ

  • アラブ首長国連邦

Geo ベースで提供される指定サービス

GPU やその他の高度な処理に依存する指定サービスの場合、顧客コンテンツはワークスペース Geo で処理されます。 詳細については、 Databricks指定サービスをご覧ください。

データは Geo から送信されますか?

顧客コンテンツは、従来の Databricks アーキテクチャが特定の地域内でデータを処理する方法と同様に、Geos で処理されます。

顧客コンテンツは、顧客ワークスペースと同じ Geo 内でのみ処理されます。

既存のコンピュート機は同じ Geo 内の別の地域に移動されますか?

いいえ。サーバーレス アーキテクチャと従来の Databricks アーキテクチャの両方で、リージョン コンピュート プレーンは、既存のすべてのサービスに対してそのリージョン内に残ります。 従来の Databricks アーキテクチャでは、コンピュート プレーンはユーザーの管理下にあるアカウント内で動作し、動作するリージョンを指定する必要があります。 サーバーレス SQL ウェアハウスなど、リージョン ベースで提供されるサーバーレス コンポーネントは、選択したリージョン外のデータを処理しません。

Geosはプレビュー機能にどのように影響しますか?

プレビュー機能には、ドキュメントに特に記載がない限り、Geo 間でのデータ処理が含まれる場合があります。

関連リソース