DatabricksIQ の信頼性と安全性

Databricks は、お客様のデータの重要性と、お客様が Databricks サービスを使用する際に当社に寄せる信頼を理解しています。 Databricks は最高水準のデータ保護に取り組んでおり、お客様の情報が確実に保護されるよう厳格な措置を講じています。

  • あなたのデータはトレーニングには使用されず、モデルパートナーはあなたのデータを保持しません。

    • Databricks も、モデルパートナー (Azure OpenAI) も、顧客データを使用してモデルをトレーニングすることはありません。 あなたのコードと入力を、他の顧客に表示する提案を生成するために使用することはありません

    • これらの機能で Databricks によって送信されたデータは、不正利用モニタリングの目的であっても、 Azure OpenAI によって保持されません。これらの機能は、その目的での Azure のデータ保持からオプトアウトされています。

  • 有害なアウトプットから保護します。 Databricksは、Azure OpenAI コンテンツ フィルターを使用して、有害なコンテンツからユーザーを保護します。 さらに、Databricksは有害なコンテンツ、ジェイルブレイク、安全でないコード生成、サードパーティの著作権コンテンツの使用を防ぐために導入された保護が効果的であることを確認するために、何千ものユーザーインタラクションをシミュレートして広範な評価を実行しました。

  • Databricks は、サービスを提供するために必要なデータのみを使用します。 データは、AI 支援機能を操作する場合にのみ送信されます。 Databricksは、より関連性の高いデータ結果を提供するために、自然言語の入力、関連するテーブルメタデータ、エラー、および入力コードやクエリを送信します。 Databricks は行レベルのデータを送信しません

  • 転送中のデータは保護されます。 Databricks と Azure OpenAI の間のすべてのトラフィックは、業界標準の TLS 暗号化を使用して転送中に暗号化されます。

  • EU のデータは EU に残ります。 欧州連合 (EU) のワークスペースの場合、AI 支援機能では、EU でホストされている Azure OpenAI モデルが使用されます。 「Databricks Geos: データ所在地」と「Databricks 指定サービス」を参照してください。

パートナーが提供する AI 支援機能の設定によって管理される機能

パートナー主導の AI とは、Azure OpenAI サービスを指します。 パートナーが提供する AI 支援機能の設定によって管理される機能の内訳を次に示します。

特徴量

モデルはどこでホストされていますか?

パートナー主導のAI設定によって制御されますか?

Databricks Assistant チャット

Azure OpenAI サービス

あり

クイックフィックス

Azure OpenAI サービス

あり

AI が生成した UC コメント (コンプライアンス セキュリティ プロファイル (CSP) ワークスペース)

Azure OpenAI サービス

はい (すべての CSP ワークスペース)

AI によって生成された UC コメント (CSP 以外のワークスペース)

Databricks でホストされるモデル

いいえ (CSP 以外のワークスペースの場合)

AI/BI dashboard AI支援ビジュアライゼーションとコンパニオン Genie spaces

Azure OpenAI サービス

あり

genie

Azure OpenAI サービス

あり

Databricks Assistantのオートコンプリート

Databricks でホストされるモデル

いいえ

インテリジェント検索

Azure OpenAI サービス

あり

Databricks Assistant に Databricks でホストされるモデルを使用する

プレビュー

この機能はパブリックプレビュー段階です。

Databricks でホストされるモデルを使用して Databricks Assistant を強化する方法について説明します。 このセクションでは、その仕組みと使用方法について説明します。

この機能を無効にするには、右上隅にあるプロファイルをクリックし、メニューから[ プレビュー ]を選択します。

仕組み

次の図は、Databricks でホストされるモデルが Databricks Assistant を強化する方法の概要を示しています。

Databricks Hosted モデルを搭載した Databricks Assistant のワークフローの図。
  1. Databricks Assistantユーザーは、コードまたは質問を入力するか、[ エラーの診断] を選択するか、セルを強調表示することで、 にプロンプトを表示します。

  2. Databricks は、メタデータを要求にアタッチし、Databricks でホストされている大規模言語モデル (LLM) に送信します。 すべてのデータは保存時に暗号化されます。 顧客は、顧客管理キー (CMK) を使用できます。

  3. ユーザー要求は、Databricks でホストされているモデルに送信されます。

Databricks でホストされるモデルは Meta Llama 3.x を使用します

Databricks AssistantDatabricksホストモデルを持つ は、現在MetaLlama 3で構築されています。 MetaLlama 3 は、MetaLlama 3 コミュニティ ライセンス 、著作権 © Meta Platforms, Inc. の下でライセンスされています。全著作権所有。

Databricksアシスタント の ホストモデルに関するFAQ

独自のプライベートモデルサービングインスタンスを持つことはできますか?

現時点ではできません。 このプレビューでは、 によって管理および保護されている モデルサービング エンドポイントDatabricks を使用します。モデルサービング エンドポイントはステートレスで、複数の分離レイヤーによって保護され、データを保護するために次のセキュリティ制御を実装します。

  • モデルサービングに対するすべての顧客リクエストは、論理的に分離され、認証され、承認されます。

  • Mosaic AI Model Serving は、保存中 (AES-256) および転送中 (TLS 1.2+) のすべてのデータを暗号化します。

モデルに送信されるメタデータは、ユーザーの Unity Catalog の権限を尊重していますか?

はい、モデルに送信されるすべてのデータは、ユーザーの Unity Catalog のアクセス許可を尊重します。 たとえば、ユーザーが表示する権限がないテーブルに関連するメタデータは送信されません。

データはどこに保存されますか?

Databricks Assistant のチャット履歴は、ノートブックと共にコントロール プレーン データベースに格納されます。 コントロールプレーンデータベースはAES-256ビットで暗号化されており、暗号化キーの制御を必要とするお客様は、当社の顧客管理キー機能を利用できます。

注:

  • 他のワークスペース オブジェクトと同様に、Databricks Assistant チャット履歴の保持期間は、オブジェクト自体のライフサイクルにスコープが設定されます。 ユーザーがノートブックを削除すると、ノートブックと関連するチャット履歴は 30 日後に削除されます。

  • ノートブックが別のユーザーと共有されている場合、チャット履歴は、最初にクリアしない限り、そのユーザーにも表示されます。

  • ノートブックがエクスポートされた場合、チャット履歴は一緒にエクスポートされません。

  • 管理者がノートブックにアクセスできる場合は、ノートブックを開いてチャット履歴を表示できます。

モデルに自分のAPIキーを持ち込んだり、自分のモデルをホストしたりすることはできますか?

現時点ではできません。 Databricks Assistantはフルマネージド で、Databricks.アシスタントの機能は、モデルサービング機能 (関数呼び出しなど)、パフォーマンス、および品質に大きく依存します。 Databricks は、最高のパフォーマンスを得るために新しいモデルを継続的に評価し、この機能の将来のバージョンでモデルを更新する可能性があります。

出力データの所有者は誰ですか? アシスタントがコードを生成する場合、その IP は誰が所有しますか?

顧客は独自の出力を所有します。