メインコンテンツまでスキップ

Databricks AI支援機能の信頼性と安全性

Databricks は、お客様が当社のプラットフォームと Databricks AI 支援機能を使用する際に、お客様のデータの重要性と当社に寄せられる信頼を理解しています。Databricks は最高水準のデータ保護に注力しており、Databricks AI 支援機能に送信される情報が保護されるように厳格な対策を実施しています。

  • お客様のデータの機密性は保たれます。

    • Databricks は、これらの機能に送信するデータを使用して生成基盤モデルをトレーニングすることはなく、 Databricks このデータを使用して他の顧客に表示される提案を生成することもありません。
    • 当社のモデル パートナーは、悪用モニタリングのためであっても、これらの機能を通じて送信されたデータを保持しません。 パートナーを活用したAI支援機能は、モデル パートナーからのデータ保持ゼロのエンドポイントを使用します。
  • 有害な出力からの保護。 Azure OpenAI を使用する場合、Databricks は Azure OpenAIコンテンツ フィルタリングも使用して、有害なコンテンツからユーザーを保護します。Anthropicモデルを使用する場合、 Databricks 、 Anthropicの組み込み 安全メカニズムと、 Anthropicの安全性に関するドキュメントに記載されている有害な出力に対する追加の強化機能に依存します。 さらに、Databricks は、有害なコンテンツ、脱獄、安全でないコード生成、サードパーティの著作権コンテンツの使用に対する保護対策が効果的であることを確認するために、何千ものユーザー インタラクションのシミュレーションによる広範な評価を実施しました。

  • Databricksは、サービスを提供するために必要なデータのみを使用します。 データは、DatabricksのAI支援機能とやり取りする場合、または機能を提供するために必要な場合にのみ送信されます。Databricksは、プロンプト、関連するテーブルメタデータと値、エラー、および入力コードまたはクエリを送信し、より関連性の高い結果を返すのに役立てます。

  • Databricks は、これらの機能に対して送信するデータ、プロンプト、または応答を使用して生成基盤モデルをトレーニングしません。 Databricks は、このデータを使用して、他の顧客に表示される提案を生成することはありません。

  • データは転送中も保存中も保護されます。 Databricks とモデルパートナー間のすべてのトラフィックは、業界標準の TLS 暗号化を使用して転送中に暗号化されます。Databricks ワークスペース内に格納されるデータはすべて AES-256 ビットで暗号化されます。

  • Databricks はデータ レジデンシー制御を提供します。 Databricks AI 支援機能は指定サービスであり、データ所在地の境界に準拠しています。詳細については、 「Databricks Geos: データ所在地」および「Databricks 指定サービス」を参照してください。

プライバシーとセキュリティに関するよくある質問

パートナーが提供する AI 支援機能ではどのようなサービスとモデルが使用されますか?

パートナー提供AI機能 設定が有効になっている場合、DatabricksのAI支援機能は、Azure OpenAIサービス、Databricks上のOpenAI、またはDatabricks上のAnthropicがホストするモデルを使用します。 パートナーが提供する AI 支援機能 の設定を無効にした場合、一部の AI 支援機能は Databricks でホストされているモデルを使用する場合があります。詳細については、「パートナーが提供する AI 機能」を参照してください。

モデルにはどのようなデータが送信されますか?

Databricks は、サービスを提供するために必要なデータのみを送信します。これは機能ごとに異なる場合があります。

Genie Code は、 各 API リクエストで機能を実行するモデルにプロンプト (質問やコードなど) と関連メタデータを送信します。これにより、データに対してより関連性の高い結果が返されます。例:

  • 現在のノートブックのセルまたは SQL エディター タブのコードとクエリ
  • テーブルと列の名前と説明
  • 以前の質問
  • お気に入りのテーブル

Genie Code エージェントモードは 、業界の他のコーディングエージェントと同様に、セル出力の分析やテーブルからのデータサンプルの読み取りも可能です。

Genie Spaces は、応答を生成する際に、プロンプト、関連するテーブルメタデータと値、エラー、および入力コードやクエリを使用します。

応答を処理するために、Genie Spacesは以下を使用します:

  • ユーザーが送信した自然言語プロンプト
  • テーブル名と説明
  • 関連する値
  • 一般的な指示
  • SQLクエリの例
  • SQL関数

Genie Ontology は、Genieが自動的に構築および維持するデータとビジネスのマップです。抽出されたオントロジースニペットは、ソースアセットとドキュメントの権限を尊重します。オントロジーを生成するには、Genieは次のようなソースからナレッジを抽出します:

  • テーブル
  • クエリー
  • ダッシュボード
  • ノートブック
  • ドキュメント
  • 接続済みアプリ

AI によって生成されたコメント の場合、Databricks は各 API 要求とともに次のメタデータをモデルに送信します。

  • カタログ(カタログ名、現在のコメント、カタログの種類)
  • スキーマ(カタログ名、スキーマ名、現在のコメント)
  • テーブル(カタログ名、スキーマ名、テーブル名、現在のコメント)
  • 関数 (カタログ名、スキーマ名、関数名、現在のコメント、パラメーター、定義)
  • モデル(カタログ名、スキーマ名、モデル名、現在のコメント、エイリアス)
  • ボリューム(カタログ名、スキーマ名、ボリューム名、現在のコメント)
  • 列名(列名、タイプ、主キーかどうか、現在の列のコメント)

パートナー モデル プロバイダーは私のデータを保存しますか?

いいえ。Databricks を通じてパートナー モデルを使用する場合、パートナー モデル プロバイダーはプロンプトや応答を保存しません。

AI支援機能ストアからの応答はどこにありますか?

Genie Spaceからの応答および承認されたAI生成コメントは、Databricksのコントロールプレーンデータベースに保存されます。制御プレーンのデータベースはAES-256ビットで暗号化されています。

Genie Code のチャット履歴は、他のノートブックのコンテンツと同じ場所に保存されます。

モデルに送信されるデータは、ユーザーのUnity Catalog権限を尊重しますか?

はい、AI 支援機能モデルに送信されるすべてのデータは Unity Catalog の権限を尊重するため、ユーザーがアクセスできないデータはそのようなモデルに送信されません。

Genie CodeまたはGenie Spacesで私のチャット履歴を見ることができるのは誰ですか?

自分のGenie Codeチャットを閲覧できます。管理者は、直接リンクを持っている場合、チャットスレッドを閲覧できます。チャットスレッドを共有すると、受信者はそれを閲覧できます。チャットスレッドを共有するを参照してください。

Genie Spaceの管理者は他のユーザーのメッセージを見ることはできますが、クエリの結果を見ることはできません。Genie Spaces での会話は、会話共有設定に従います。

Genie SpacesやGenie Codeはコードを実行しますか?

Genie Spacesは顧客データへの読み取り専用アクセスで設計されているため、読み取り専用のSQLクエリのみを生成および実行できます。

エージェント モードでは、Genie Code はノートブックと SQL エディターでコードを実行できます。まず、Genie Code は実行を続行するかどうかの確認を求めます。確認するか、現在の Genie Code スレッドで常に実行を許可するか、常に実行を許可するかを選択できます。その他の Genie Code モードでは、自動的にコードは実行されません。

AI モデルは間違いを犯したり、意図を誤解したり、幻覚を見たり、間違った答えを出したりする可能性があります。AI が生成したコードを実行する前に、確認してテストします。

Databricks は、AI 支援機能からの応答の正確性と適切性を評価するための評価を実施しましたか?

はい、Databricks は、想定されるユースケースに基づいてすべての AI 支援機能を広範囲にテストし、シミュレートされたユーザー入力を使用して応答の精度と適切性を高めています。ただし、生成AIは新興技術であり、 AI支援機能は不正確または不適切な応答を返す可能性があります。

トラフィックは Geos を通じてどのようにルーティングされますか?

Databricks AI 支援機能は、顧客コンテンツを処理する際にDatabricks Geos を 使用してデータの所在地を管理する指定サービス です。トラフィック ルーティングは、リージョンと、クロスジオ処理が有効になっているかどうか ( 指定サービスのワークスペース ジオグラフィ内でのデータ処理の適用 が無効) によって異なります。

AI 支援機能は Databricks がホストするモデルでどのように機能しますか?

パートナーが提供するAI機能が無効になっている場合、AIアシスト機能は、Databricksが完全に選択および管理するDatabricksホスト型モデルを使用します。Databricksは、OpenAI GPT OSSのような商用利用可能なオープンソースモデルを使用します。

次の図は、Databricks でホストされるモデルが Quick Fix などの Databricks AI を利用した機能を強化する方法の概要を示しています。

Databricks がホストするモデルを活用した Genie Code のワークフローの図。

  1. ユーザーがノートブックのセルを実行すると、エラーが発生します。
  2. Databricks は、メタデータを要求にアタッチし、Databricks でホストされている大規模言語モデル (LLM) に送信します。すべてのデータは保存時に暗号化されます。顧客は、顧客管理キー (CMK) を使用できます。
  3. Databricks でホストされるモデルは、エラーを修正するための提案されたコード編集で応答し、ユーザーに表示されます。