Databricks AI支援機能の信頼性と安全性

Databricks は、お客様が当社のプラットフォームと Databricks AI 支援機能を使用する際に、お客様のデータの重要性と当社に寄せられる信頼を理解しています。Databricks は最高水準のデータ保護に注力しており、Databricks AI 支援機能に送信される情報が保護されるように厳格な対策を実施しています。

お客様のデータの機密性は保たれます。
- Databricks は、これらの機能に送信するデータを使用して生成基盤モデルをトレーニングすることはなく、 Databricks このデータを使用して他の顧客に表示される提案を生成することもありません。
- 当社のモデルパートナーは、悪用モニタリングのためであっても、これらの機能を通じて送信されたデータを保持しません。パートナーを活用したAI支援機能は、モデルパートナーからのデータ保持ゼロのエンドポイントを使用します。
有害な出力からの保護。 Azure OpenAI を使用する場合、Databricks は Azure OpenAIコンテンツフィルタリングも使用して、有害なコンテンツからユーザーを保護します。Anthropicモデルを使用する場合、 Databricks 、 Anthropicの組み込み安全メカニズムと、 Anthropicの安全性に関するドキュメントに記載されている有害な出力に対する追加の強化機能に依存します。さらに、Databricks は、有害なコンテンツ、脱獄、安全でないコード生成、サードパーティの著作権コンテンツの使用に対する保護対策が効果的であることを確認するために、何千ものユーザーインタラクションのシミュレーションによる広範な評価を実施しました。
Databricks はサービスを提供するために必要なデータのみを使用します。 データは、Databricks AI 支援機能と対話した場合にのみ送信されます。Databricks は、プロンプト、関連するテーブルメタデータと値、エラー、および入力コードやクエリを送信して、より関連性の高い結果を返すのに役立ちます。
Databricks は、これらの機能に対して送信するデータ、プロンプト、または応答を使用して生成基盤モデルをトレーニングしません。 Databricks は、このデータを使用して、他の顧客に表示される提案を生成することはありません。
データは転送中も保存中も保護されます。 Databricks とモデルパートナー間のすべてのトラフィックは、業界標準の TLS 暗号化を使用して転送中に暗号化されます。Databricks ワークスペース内に格納されるデータはすべて AES-256 ビットで暗号化されます。
Databricks はデータレジデンシー制御を提供します。 Databricks AI 支援機能は指定サービスであり、データ所在地の境界に準拠しています。詳細については、「Databricks Geos: データ所在地」および「Databricks 指定サービス」を参照してください。

Databricks Assistant のプライバシーの詳細については、「プライバシーとセキュリティに関する FAQ」を参照してください。

プライバシーとセキュリティに関するよくある質問

パートナーが提供する AI 支援機能ではどのようなサービスとモデルが使用されますか?

パートナーが提供する AI 機能の 設定が有効になっている場合、Databricks AI 支援機能は、Azure OpenAI サービスまたは Databricks 上の Anthropic によってホストされるモデルを使用します。 パートナーが提供する AI 機能の 設定を無効にすると、一部の AI 支援機能では Databricks がホストするモデルが使用される場合があります。詳細については、「パートナーが活用するAI機能」を参照してください。

モデルにはどのようなデータが送信されますか?

Databricks は、サービスを提供するために必要なデータのみを送信します。これは機能ごとに異なる場合があります。

Databricks Assistant は 、各 API 要求で機能を強化するモデルに、プロンプト (質問やコードなど) と関連メタデータを送信します。これにより、データに対してより関連性の高い結果が返されます。例:

現在のノートブックのセルまたは SQL エディタータブのコードとクエリ
テーブルと列の名前と説明
以前の質問
お気に入りのテーブル

現在ベータ版となっている Databricks Assistant Agent Mode では、業界の他のコーディングエージェントと同様に、セル出力を分析し、テーブルからデータサンプルを読み取ることもできます。

Genie は 、応答を生成するときに、プロンプト、関連するテーブルのメタデータと値、エラー、および入力コードまたはクエリを使用します。

応答を処理するために、Genie は以下を使用します。

ユーザーが送信した自然言語プロンプト
テーブル名と説明
関連する値
一般的な指示
SQLクエリの例
SQL関数

AI によって生成されたコメント の場合、Databricks は各 API 要求とともに次のメタデータをモデルに送信します。

カタログ（カタログ名、現在のコメント、カタログの種類）
スキーマ（カタログ名、スキーマ名、現在のコメント）
テーブル（カタログ名、スキーマ名、テーブル名、現在のコメント）
関数 (カタログ名、スキーマ名、関数名、現在のコメント、パラメーター、定義)
モデル（カタログ名、スキーマ名、モデル名、現在のコメント、エイリアス）
ボリューム（カタログ名、スキーマ名、ボリューム名、現在のコメント）
列名（列名、タイプ、主キーかどうか、現在の列のコメント）

パートナーモデルプロバイダーは私のデータを保存しますか?

いいえ。Databricks を通じてパートナーモデルを使用する場合、パートナーモデルプロバイダーはプロンプトや応答を保存しません。

AI支援機能ストアからの応答はどこにありますか?

Genie の応答と承認された AI 生成コメントは、Databricks コントロールプレーンデータベースに保存されます。コントロールプレーンデータベースは AES-256 ビットで暗号化されています。

Databricks Assistant のチャット履歴は、他のノートブックコンテンツと同じ場所に保存されます。

モデルに送信されるデータは、ユーザーのUnity Catalog権限を尊重しますか?

はい、AI 支援機能モデルに送信されるすべてのデータは Unity Catalog の権限を尊重するため、ユーザーがアクセスできないデータはそのようなモデルに送信されません。

他のユーザーがアシスタントや Genie とのチャット履歴を見ることはできますか?

アシスタントとのやり取りは、それを開始したユーザーのみに表示されます。

Genieスペースマネージャーは他のユーザーのメッセージを見ることができますが、クエリの結果を見ることはできません。

Genie または Databricks Assistant はコードを実行しますか?

Genie は顧客データへの読み取り専用アクセスで設計されているため、読み取り専用の SQL クエリのみを生成して実行できます。

エージェントModeを使用すると、アシスタントはノートブックやSQLエディターでコードを実行できます。最初に、アシスタントは実行を続行するかどうかの確認を求めます。確認するか、現在の Databricks Assistant スレッドで常に実行を許可するか、常に実行を許可するかを選択できます。その他のDatabricks Assistantモードでは、ユーザーに代わってコードを自動的に実行することはありません。

AI モデルは間違いを犯したり、意図を誤解したり、幻覚を見たり、間違った答えを出したりする可能性があります。AI が生成したコードを実行する前に、確認してテストします。

Databricks は、AI 支援機能からの応答の正確性と適切性を評価するための評価を実施しましたか?

はい、Databricks は、想定されるユースケースに基づいてすべての AI 支援機能を広範囲にテストし、シミュレートされたユーザー入力を使用して応答の精度と適切性を高めています。ただし、生成AIは新興技術であり、 AI支援機能は不正確または不適切な応答を返す可能性があります。

規制対象データ (PHI、PCI、IRAP、FedRAMP) を処理するテーブルで AI 支援機能を使用できますか?

はい。そのためには、コンプライアンス・セキュリティー・プロファイルの有効化などの要件に準拠し、コンプライアンス・セキュリティー・プロファイル構成の一部として関連するコンプライアンス標準を追加する必要があります。

トラフィックは Geos を通じてどのようにルーティングされますか?

Databricks AI 支援機能は、顧客コンテンツを処理する際にDatabricks Geos を使用してデータの所在地を管理する指定サービスです。トラフィックルーティングは、リージョンと、クロスジオ処理が有効になっているかどうか ( 指定サービスのワークスペースジオグラフィ内でのデータ処理の適用 が無効) によって異なります。

AI 支援機能は Databricks がホストするモデルでどのように機能しますか?

Databricks AI 支援機能では、Databricks がホストするモデルを使用する場合、OpenAI GPT OSS または商用利用可能なその他のモデルが使用されます。生成AIモデルのライセンスと使用については、「情報」を参照してください。

次の図は、Databricks でホストされるモデルが Quick Fix などの Databricks AI を利用した機能を強化する方法の概要を示しています。

Databricks がホストするモデルを活用した Genie Code のワークフローの図。

ユーザーがノートブックのセルを実行すると、エラーが発生します。
Databricks は、メタデータを要求にアタッチし、Databricks でホストされている大規模言語モデル (LLM) に送信します。すべてのデータは保存時に暗号化されます。顧客は、顧客管理キー (CMK) を使用できます。
Databricks でホストされるモデルは、エラーを修正するための提案されたコード編集で応答し、ユーザーに表示されます。

プライバシーとセキュリティに関するよくある質問​

パートナーが提供する AI 支援機能ではどのようなサービスとモデルが使用されますか?​

モデルにはどのようなデータが送信されますか?​

パートナー モデル プロバイダーは私のデータを保存しますか?​

AI支援機能ストアからの応答はどこにありますか?​

モデルに送信されるデータは、ユーザーのUnity Catalog権限を尊重しますか?​

他のユーザーがアシスタントや Genie とのチャット履歴を見ることはできますか?​

Genie または Databricks Assistant はコードを実行しますか?​

Databricks は、AI 支援機能からの応答の正確性と適切性を評価するための評価を実施しましたか?​

規制対象データ (PHI、PCI、IRAP、FedRAMP) を処理するテーブルで AI 支援機能を使用できますか?​

トラフィックは Geos を通じてどのようにルーティングされますか?​

AI 支援機能は Databricks がホストするモデルでどのように機能しますか?​