Databricks AI支援機能の信頼性と安全性
Databricks は、お客様が当社のプラットフォームと Databricks AI 支援機能を使用する際に、お客様のデータの重要性と当社に寄せられる信頼を理解しています。Databricks は最高水準のデータ保護に注力しており、Databricks AI 支援機能に送信される情報が保護されるように厳格な対策を実施しています。
-
お客様のデータの機密性は保たれます。
- Databricks は、これらの機能に送信するデータを使用して生成基盤モデルをトレーニングすることはなく、 Databricks このデータを使用して他の顧客に表示される提案を生成することもありません。
- 当社のモデル パートナーは、悪用モニタリングのためであっても、これらの機能を通じて送信されたデータを保持しません。 パートナーを活用したAI支援機能は、モデル パートナーからのデータ保持ゼロのエンドポイントを使用します。
-
有害な出力からの保護。 Azure Open AI を使用する場合、Databricks は Azure OpenAIコンテンツ フィルタリングも使用して、有害なコンテンツからユーザーを保護します。さらに、Databricks は、有害なコンテンツ、脱獄、安全でないコード生成、サードパーティの著作権コンテンツの使用に対する保護対策が効果的であることを確認するために、何千ものユーザー インタラクションのシミュレーションによる広範な評価を実施しました。
-
Databricks はサービスを提供するために必要なデータのみを使用します。 データは、Databricks AI 支援機能と対話した場合にのみ送信されます。Databricks は、プロンプト、関連するテーブル メタデータと値、エラー、および入力コードやクエリを送信して、より関連性の高い結果を返すのに役立ちます。
-
Databricks は、これらの機能に対して送信するデータ、プロンプト、または応答を使用して生成基盤モデルをトレーニングしません。 Databricks は、このデータを使用して、他の顧客に表示される提案を生成することはありません。
-
データは転送中も保存中も保護されます。 Databricks とモデルパートナー間のすべてのトラフィックは、業界標準の TLS 暗号化を使用して転送中に暗号化されます。Databricks ワークスペース内に格納されるデータはすべて AES-256 ビットで暗号化されます。
-
Databricks はデータ レジデンシー制御を提供します。 Databricks AI 支援機能は指定サービスであり、データ所在地の境界に準拠しています。詳細については、 「Databricks Geos: データ所在地」および「Databricks 指定サービス」を参照してください。
Databricks Assistant のプライバシーの詳細については、 「プライバシーとセキュリティに関する FAQ」を参照してください。
プライバシーとセキュリティに関するよくある質問
パートナーが提供する AI 支援機能ではどのようなサービスとモデルが使用されますか?
パートナーが提供する AI 機能の 設定が有効になっている場合、Databricks AI 支援機能は Azure OpenAI サービスまたは Amazon Bedrock によってホストされるモデルを使用します。 パートナーが提供する AI 機能の 設定を無効にすると、一部の AI 支援機能では Databricks がホストするモデルが使用される場合があります。詳細については、 「パートナーが活用するAI機能」を参照してください。
モデルにはどのようなデータが送信されますか?
Databricks は、サービスを提供するために必要なデータのみを送信します。これは機能ごとに異なる場合があります。
Databricks Assistant は 、各 API 要求で機能を強化するモデルに、プロンプト (質問やコードなど) と関連メタデータを送信します。これにより、データに対してより関連性の高い結果が返されます。例:
- 現在のノートブックのセルまたは SQL エディター タブのコードとクエリ
- テーブルと列の名前と説明
- 以前の質問
- お気に入りのテーブル
現在 ベータ版 となっている アシスタント エージェントMode では、業界の他のコーディング エージェントと同様に、セル出力を分析し、テーブルからデータ サンプルを読み取ることもできます。
Genie は 、応答を生成するときに、プロンプト、関連するテーブルのメタデータと値、エラー、および入力コードまたはクエリを使用します。
応答を処理するために、Genie は以下を使用します。
- ユーザーが送信した自然言語プロンプト
- テーブル名と説明
- 関連する値
- 一般的な指示
- SQLクエリの例
- SQL関数
AI によって生成されたコメント の場合、Databricks は各 API 要求とともに次のメタデータをモデルに送信します。
- カタログ(カタログ名、現在のコメント、カタログの種類)
- スキーマ(カタログ名、スキーマ名、現在のコメント)
- テーブル(カタログ名、スキーマ名、テーブル名、現在のコメント)
- 関数 (カタログ名、スキーマ名、関数名、現在のコメント、問題、定義)
- モデル(カタログ名、スキーマ名、モデル名、現在のコメント、エイリアス)
- ボリューム(カタログ名、スキーマ名、ボリューム名、現在のコメント)
- 列名(列名、タイプ、主キーかどうか、現在の列のコメント)
パートナー モデル プロバイダーは私のデータを保存しますか?
いいえ。Databricks を通じてパートナー モデルを使用する場合、パートナー モデル プロバイダーはプロンプトや応答を保存しません。
AI支援機能ストアからの応答はどこにありますか?
Genie の応答と承認された AI 生成コメントは、Databricks コントロール プレーン データベースに保存されます。コントロール プレーン データベースは AES-256 ビットで暗号化されています。
アシスタントのチャット履歴は、他のノートブックのコンテンツと同じ場所に保存されます。
モデルに送信されるデータは、ユーザーのUnity Catalog権限を尊重しますか?
はい、AI 支援機能モデルに送信されるすべてのデータは Unity Catalog の権限を尊重するため、ユーザーがアクセスできないデータはそのようなモデルに送信されません。
他のユーザーがアシスタントや Genie とのチャット履歴を見ることはできますか?
アシスタントとのやり取りは、それを開始したユーザーのみに表示されます。
Genieスペース マネージャーは他のユーザーのメッセージを見ることができますが、クエリの結果を見ることはできません。
Genie または Databricks Assistant はコードを実行しますか?
Genie は顧客データへの読み取り専用アクセスで設計されているため、読み取り専用の SQL クエリのみを生成して実行できます。
エージェント Modeを使用すると、アシスタントはノートブックと SQL エディタでコードを実行できます。 最初に、アシスタントは実行を続行するための確認を求めます。確認するか、現在のアシスタントスレッドでの実行を常に許可するか、または常に実行を許可するかを選択できます。他のアシスタント モードでは、ユーザーに代わってコードが自動的に実行されることはありません。
AI モデルは間違いを犯したり、意図を誤解したり、幻覚を見たり、間違った答えを出したりする可能性があります。AI が生成したコードを実行する前に、確認してテストします。
Databricks は、AI 支援機能からの応答の正確性と適切性を評価するための評価を実施しましたか?
はい、Databricks は、想定されるユースケースに基づいてすべての AI 支援機能を広範囲にテストし、シミュレートされたユーザー入力を使用して応答の精度と適切性を高めています。ただし、生成AIは新興技術であり、 AI支援機能は不正確または不適切な応答を返す可能性があります。
規制対象データ (PHI、PCI、IRAP、FedRAMP) を処理するテーブルで AI 支援機能を使用できますか?
はい。そのためには、 コンプライアンス・セキュリティー・プロファイルの有効化などの要件に準拠し、コンプライアンス・セキュリティー・プロファイル構成の一部として関連するコンプライアンス標準を追加する必要があります。
トラフィックは Geos を通じてどのようにルーティングされますか?
Databricks AI 支援機能は、顧客コンテンツを処理する際にDatabricks Geos を 使用してデータの所在地を管理する指定サービス です。トラフィック ルーティングは、リージョンと、クロスジオ処理が有効になっているかどうか ( 指定サービスのワークスペース ジオグラフィ内でのデータ処理の適用 が無効) によって異なります。
AI 支援機能は Databricks がホストするモデルでどのように機能しますか?
Databricks AI 支援機能では、Databricks がホストするモデルを使用する場合、Meta Llama 3 または商用利用可能なその他のモデルが使用されます。生成AIモデルのライセンスと使用については、「情報」を参照してください。
次の図は、Databricks でホストされるモデルが Quick Fix などの Databricks AI を利用した機能を強化する方法の概要を示しています。
- ユーザーがノートブックのセルを実行すると、エラーが発生します。
- Databricks は、メタデータを要求にアタッチし、Databricks でホストされている大規模言語モデル (LLM) に送信します。すべてのデータは保存時に暗号化されます。顧客は、顧客管理キー (CMK) を使用できます。
- Databricks でホストされるモデルは、エラーを修正するための提案されたコード編集で応答し、ユーザーに表示されます。