パッケージ化されたクリーンルーム
プレビュー
この機能は パブリック プレビュー段階です。
このページでは、Databricks クリーンルームのプロバイダーとコンシューマーのコラボレーションモデルであるパッケージ化されたクリーンルームについて説明します。
パッケージドクリーンルームでは、1人の協力者が 提供者 、もう1人が 消費者 です。
- 提供者 はノートブックやJARの作成者であり、データ資産も提供します。プロバイダーのコードとデータ資産は、消費者からは隠蔽されている。
- **コンシューマー**は、独自のデータアセットを提供し、実行をトリガーし、実行出力を表示できます。コンシューマーは、プロバイダーのノートブック、JARコード、またはデータアセットを表示できません。
どちらのコラボレーターも、お互いのデータアセットを見ることはできません。プロバイダーまたはコンシューマーのどちらかがクリーンルームを作成できます。作成者が、どのコラボレーターがパッケージプロバイダーであるかを指定します。「クリーンルームを作成する」と「招待されたコラボレーターとしてDatabricks クリーンルームを使用する」を参照してください。
これは、承認ベースのクリーンルームとは異なり、すべてのコラボレーターが同等の特権を持ち、実行前にすべてのノートブックをレビューできます。クリーンルームがどのようにして信頼のない環境を保証するかをご覧ください。パッケージドクリーンルームは、プロバイダーがパッケージ分析(プライベートライブラリーに似たもの)を提供したい場合に有用です。消費者はプロバイダーのコードを検査せずに自分のデータと照合して実行できます。
パッケージ化されたクリーンルームが承認ベースのクリーンルームとの違い
以下の表は、パッケージ化されたクリーンルームにおける各コラボレーターの能力と、承認ベースのクリーンルームの能力を比較しています。
機能 | 承認ベース | パッケージ入り(消費者向け) | パッケージ(プロバイダー) |
|---|---|---|---|
ノートとJARを見る | すべてのコードが表示されます | 名前のみ、コードは不要 | 自作ノートとJARs(記録用ジャーナル・アット・ア・リ |
ノートやJARを追加しましょう | はい | No | はい |
データ資産を表示する | すべて表示可能 | 所有資産のみ | 所有資産のみ |
データアセットを追加 | はい | はい | はい |
実行出力を見る | はい | はい | No |
アクセス出力テーブル | ランナーのみ | 消費者(ランナー)専用 | No |
共有出力テーブルにアクセスする | はい | はい | はい |
トリガー実行 | はい | はい | No |
自動承認ルール | はい | No | No |
セキュリティと信頼モデル
消費者はプロバイダーのノートブックやJARコードを検査できないため、プロバイダーのコードが記述通りに動作することを信頼しなければなりません。これはプライベートライブラリの使用に似ています。
クリーンルームのエグレスネットワークポリシーは、プロバイダーのコードがインターネットや特定の外部エンドポイントに到達できるかを制御します。もしEgressがオープンであったり、消費者が快適でないエンドポイントを許可している場合、プロバイダーのコードは消費者のデータをクリーンルームの外に送り出す可能性があります。
パッケージされたクリーンルームに機密データを提供する前に、その退出ネットワークポリシーを確認してください。サーバレスのエグレス制御とは何か?を参照してください。
始める前に
- パッケージドモードはクリーンルーム作成時に設定され、その後は変更できません。
パッケージ化されたクリーンルームを作る
提供者も消費者もパッケージされたクリーンルームを作ることができます。手順は承認ベースのクリーンルームと同じですが、パッケージされたクリーンルームの種類を選択し、パッケージ提供者を指定します。
- Databricks ワークスペースで、
カタログ をクリックします。
- 右上で「 クリーンルーム > 共有 」をクリックします。
- クリーンルームの作成 をクリックします。
- クリーン ルームタイプ の中で 「パッケージドクリーンルーム 」を選択してください。
- クリーンルーム名 を入力し、中央クリーンルームの 地域 を選択してください。
- コラボレーターの詳細 欄に、他のコラボレーターの クリーンルーム共有識別子 を入力し、「 コラボレーターを追加」 をクリックします。
- 指定クリーンルームパッケージプロバイダー については、「 あなた 」または 「招待されたコラボレーター 」を選択して、どちらのコラボレーターがパッケージプロバイダーかを選びます。パッケージプロバイダーの資産は、他の共同作業者からは隠蔽されています。
- クリーンルームの作成 をクリックします。
パッケージドモードはクリーンルーム作成時に設定され、その後は変更できません。
提供者のタスク
提供者として、ノートブック、JAR、データを供給し、消費者が引き起こす実行を監視できます。
-
ノートブック、JAR、データ資産を追加する :承認ベースのクリーンルームで行うのと同じ方法で資産を追加します。ステップ 3を参照してください。クリーンルームにデータ資産やノートを追加しましょう。あなたの資産はあなたにのみ表示され、消費者のデータ資産を見ることはできません。
-
実行履歴の監視 :消費者はノートパソコンやJARを使う実行をトリガーします。消費者の実行履歴は見られますが、実行出力は見られません。Monitorクリーンルームノートブックの実行を参照してください。
消費者タスク
消費者として、あなたは自分のデータを提供し、プロバイダーのコードに対して実行をトリガーし、その結果を確認します。
-
パッケージされたクリーンルームを開く と、プロバイダーのノートブックやJARの名前は見えますが、ソースコードは見えません。
-
データ資産を追加する :入力 データを追加 して、テーブル、ボリューム、モデルをクリーンルームに追加してください。あなたのデータはあなただけが見ることができ、プロバイダーはそれを見ることができません。
-
実行をトリガー する:プロバイダーのコードはクリーンルームの安全な環境で実行され、両共同研究者が貢献したデータ資産にアクセスできます。
-
実行出力を見る :実行の出力を見ることができます。結果を他のユーザーと共有するために、プロバイダーのコードは、すべての共同作業者が読み取ることができる共有出力スキーマに書き込むこともできます。Databricksのクリーンルームで出力テーブルを作成・作業する方法をご覧ください。
制限事項:
- パッケージモードはクリーンルーム作成時に設定され、その後無効化することはできません。
- プロバイダーを含むすべての共同作業者に対して、自動承認ルールは無効になっています。