Delta Sharingオープン共有プロトコルを使用したデータの共有 (プロバイダー向け)

この記事では、プロバイダーが Delta Sharing オープン共有プロトコルを使用して、Unity カタログ対応の Databricks ワークスペースのデータを、任意のコンピューティング プラットフォーム上の任意の場所のすべてのユーザーと共有する方法の概要について説明します。

データ受信者 (データが共有されているユーザーまたはユーザーのグループ) である場合は、代わりに「Delta Sharingを使用して共有されたデータにアクセスする (受信者の場合)」を参照してください。

誰が Delta Sharing オープン共有プロトコルを使用する必要がありますか?

Delta Sharing を使用してデータを共有するには、次の 3 つの方法があります。

  1. この記事で取り上げる Databricks オープン共有プロトコルを使用すると、Unity Catalog 対応の Databricks ワークスペースで管理しているデータを、任意のコンピューティング プラットフォームのユーザーと共有できます。

    この方法では、Databricks に組み込まれている Delta Sharing サーバーを使用し、 Unity Catalog を使用してデータを管理し、Databricks を使用していないユーザーや、 Unity Catalog対応の Databricks ワークスペースにアクセスできないユーザーと共有する場合に便利です。 プロバイダー側の Unity Catalog との統合により、プロバイダーのセットアップとガバナンスが簡素化されます。

  2. オープンソースの Delta Sharing サーバーの顧客管理実装 により、Databricks かどうかに関係なく、任意のプラットフォームから任意のプラットフォームに共有できます。

    github.com/delta-io/delta-sharing を参照してください。

  3. Databricks から Databricks への共有プロトコル を使用すると、Unity Catalog 対応ワークスペースのデータを、Unity Catalog 対応の Databricks ワークスペースにもアクセスできるユーザーと共有できます。

    Delta Sharing の Databricks-to-Databricks プロトコルを使用してデータを共有する (プロバイダー向け)」を参照してください。

Delta Sharingの概要とこれら 3 つのアプローチに関する詳細については、 Delta Sharing使用してデータと AI 資産を安全に共有する」を参照してください。

Delta Sharingのオープンな共有ワークフロー

このセクションでは、オープン共有ワークフローの概要と、各ステップの詳細なドキュメントへのリンクを示します。

Delta Sharing オープン共有モデルの場合:

  1. データ プロバイダーは、データ プロバイダーがデータを共有するユーザーまたはユーザーのグループを表す名前付きオブジェクトである 受信者を作成します。

    データ プロバイダーが受信者を作成すると、Databricks はトークン、トークンを含む資格情報ファイル、およびデータ プロバイダーが資格情報ファイルにアクセスするために受信者に送信できるアクティブ化リンクを生成します。

    詳細については、「 ステップ 1: 受信者を作成する」を参照してください。

  2. データ プロバイダーは、プロバイダーのアカウントの Unity Catalog メタストアに登録されているテーブルのコレクションを含む名前付きオブジェクトである 共有を作成します。

    詳しくは、 Delta Sharingの共有の作成と管理を参照してください。

  3. データ プロバイダーは、受信者に共有へのアクセス権を付与します。

    詳細については、「 Delta Sharing データ共有へのアクセスの付与と管理 (プロバイダー向け)」を参照してください。

  4. データ プロバイダーは、アクティブ化リンクを使用して、受信者がデータ プロバイダーとのセキュリティで保護された接続を確立して共有データを受信するために使用する資格情報ファイルをダウンロードするための手順と共に、セキュリティで保護されたチャネルを介して受信者にアクティブ化リンクを送信します。

    詳しくは、 ステップ 2: アクティベーション リンクを取得するをご覧ください。

  5. データ受信者は、アクティブ化リンクに従って資格情報ファイルをダウンロードし、資格情報ファイルを使用して共有データにアクセスします。

    共有データは読み取り専用で使用できます。 ユーザーは、選択したプラットフォームまたはツールを使用してデータにアクセスできます。

    詳しくは、オープン共有を使用して共有されたデータの読み取り (受信者用)Delta Sharingを参照してください。

オープン共有のセットアップとセキュリティに関する考慮事項

オープン共有モデルを使用する場合、適切なトークン管理は、データを安全に共有するための鍵です。

  • オープン共有を使用する予定のデータ プロバイダーは、 Unity Catalog メタストアの Delta Sharing を有効にするときに、既定の受信者トークンの有効期間を構成する必要があります。 Databricks では、トークンの有効期限が切れるように構成することをお勧めします。 「 メタストアでの Delta Sharing の有効化」を参照してください。

  • 既定のトークンの有効期間を変更する必要がある場合は、「 受信者トークンの有効期間を変更する」を参照してください。

  • ダウンロードした資格情報ファイルを安全に管理するように受信者に促します。

  • トークン管理とオープン共有セキュリティの詳細については、「 受信者トークンの管理 (オープン共有)」を参照してください。

データ プロバイダーは、IP アクセス リストを割り当てて、受信者のアクセスを特定のネットワーク ロケーションに制限することで、セキュリティを強化できます。 「IP アクセス リストを使用して受信者 Delta Sharing アクセスを制限する (オープン共有)」を参照してください。