メインコンテンツまでスキップ

パッケージ化されたクリーンルーム

備考

プレビュー

この機能は パブリック プレビュー段階です。

このページでは、Databricks クリーンルームのプロバイダーとコンシューマーのコラボレーションモデルであるパッケージ化されたクリーンルームについて説明します。

パッケージドクリーンルームでは、1人の協力者が 提供者 、もう1人が 消費者 です。

  • 提供者 はノートブックやJARの作成者であり、データ資産も提供します。プロバイダーのコードとデータ資産は、消費者からは隠蔽されている。
  • **コンシューマー**は、独自のデータアセットを提供し、実行をトリガーし、実行出力を表示できます。コンシューマーは、プロバイダーのノートブック、JARコード、またはデータアセットを表示できません。

どちらのコラボレーターも、お互いのデータアセットを見ることはできません。プロバイダーまたはコンシューマーのどちらかがクリーンルームを作成できます。作成者が、どのコラボレーターがパッケージプロバイダーであるかを指定します。「クリーンルームを作成する」と「招待されたコラボレーターとしてDatabricks クリーンルームを使用する」を参照してください。

これは、承認ベースのクリーンルームとは異なり、すべてのコラボレーターが同等の特権を持ち、実行前にすべてのノートブックをレビューできます。クリーンルームがどのようにして信頼のない環境を保証するかをご覧ください。パッケージドクリーンルームは、プロバイダーがパッケージ分析(プライベートライブラリーに似たもの)を提供したい場合に有用です。消費者はプロバイダーのコードを検査せずに自分のデータと照合して実行できます。

パッケージ化されたクリーンルームが承認ベースのクリーンルームとの違い

以下の表は、パッケージ化されたクリーンルームにおける各コラボレーターの能力と、承認ベースのクリーンルームの能力を比較しています。

機能

承認ベース

パッケージ入り(消費者向け)

パッケージ(プロバイダー)

ノートとJARを見る

すべてのコードが表示されます

名前のみ、コードは不要

自作ノートとJARs(記録用ジャーナル・アット・ア・リ

ノートやJARを追加しましょう

はい

No

はい

データ資産を表示する

すべて表示可能

所有資産のみ

所有資産のみ

データアセットを追加

はい

はい

はい

実行出力を見る

はい

はい

No

アクセス出力テーブル

ランナーのみ

消費者(ランナー)専用

No

共有出力テーブルにアクセスする

はい

はい

はい

トリガー実行

はい

はい

No

自動承認ルール

はい

No

No

セキュリティと信頼モデル

消費者はプロバイダーのノートブックやJARコードを検査できないため、プロバイダーのコードが記述通りに動作することを信頼しなければなりません。これはプライベートライブラリの使用に似ています。

クリーンルームのエグレスネットワークポリシーは、プロバイダーのコードがインターネットや特定の外部エンドポイントに到達できるかを制御します。もしEgressがオープンであったり、消費者が快適でないエンドポイントを許可している場合、プロバイダーのコードは消費者のデータをクリーンルームの外に送り出す可能性があります。

パッケージされたクリーンルームに機密データを提供する前に、その退出ネットワークポリシーを確認してください。サーバレスのエグレス制御とは何か?を参照してください。

始める前に

  • パッケージドモードはクリーンルーム作成時に設定され、その後は変更できません。

パッケージ化されたクリーンルームを作る

提供者も消費者もパッケージされたクリーンルームを作ることができます。手順は承認ベースのクリーンルームと同じですが、パッケージされたクリーンルームの種類を選択し、パッケージ提供者を指定します。

  1. Databricks ワークスペースで、データアイコン。 カタログ をクリックします。
  2. 右上で「 クリーンルーム > 共有 」をクリックします。
  3. クリーンルームの作成 をクリックします。
  4. クリーン ルームタイプ の中で 「パッケージドクリーンルーム 」を選択してください。
  5. クリーンルーム名 を入力し、中央クリーンルームの 地域 を選択してください。
  6. コラボレーターの詳細 欄に、他のコラボレーターの クリーンルーム共有識別子 を入力し、「 コラボレーターを追加」 をクリックします。
  7. 指定クリーンルームパッケージプロバイダー については、「 あなた 」または 「招待されたコラボレーター 」を選択して、どちらのコラボレーターがパッケージプロバイダーかを選びます。パッケージプロバイダーの資産は、他の共同作業者からは隠蔽されています。
  8. クリーンルームの作成 をクリックします。

パッケージドモードはクリーンルーム作成時に設定され、その後は変更できません。

提供者のタスク

提供者として、ノートブック、JAR、データを供給し、消費者が引き起こす実行を監視できます。

消費者タスク

消費者として、あなたは自分のデータを提供し、プロバイダーのコードに対して実行をトリガーし、その結果を確認します。

  • パッケージされたクリーンルームを開く と、プロバイダーのノートブックやJARの名前は見えますが、ソースコードは見えません。

  • データ資産を追加する :入力 データを追加 して、テーブル、ボリューム、モデルをクリーンルームに追加してください。あなたのデータはあなただけが見ることができ、プロバイダーはそれを見ることができません。

  • 実行をトリガー する:プロバイダーのコードはクリーンルームの安全な環境で実行され、両共同研究者が貢献したデータ資産にアクセスできます。

  • 実行出力を見る :実行の出力を見ることができます。結果を他のユーザーと共有するために、プロバイダーのコードは、すべての共同作業者が読み取ることができる共有出力スキーマに書き込むこともできます。Databricksのクリーンルームで出力テーブルを作成・作業する方法をご覧ください。

制限事項:

  • パッケージモードはクリーンルーム作成時に設定され、その後無効化することはできません。
  • プロバイダーを含むすべての共同作業者に対して、自動承認ルールは無効になっています。