AI が生成したコメントをテーブルに追加する

この記事では、AI によって生成された表と列のコメント (AI によって生成されたドキュメントとも呼ばれます) を紹介し、その仕組みを説明し、追加および編集する方法を示し、よくある質問に回答します。

AIが生成したコメントはどのように機能するか?

テーブル所有者またはテーブルを変更する権限を持つユーザーは、カタログ エクスプローラーを使用して、Unity Catalog によって管理される任意のテーブルまたはテーブル列の AI 生成コメントを表示および追加できます。 コメントは、テーブル スキーマや列名などのテーブル メタデータをアカウントに取り込む大規模言語モデル ( LLM ) によって実行されます。

AI によって生成されたコメントは、ユーザーが Unity Catalog によって管理されるデータをすばやく見つけられるようにします。

重要

AI によって生成されたコメントは、スキーマに基づいてテーブルと列の一般的な説明を提供することを目的としています。 説明は、さまざまな業界の複数のオープン データセットのサンプル スキーマを使用して、ビジネスおよびエンタープライズ コンテキストのデータに合わせて調整されています。 このモデルは、有害または不適切な記述を生成しないことを検証するために、何百ものシミュレートされたサンプルで評価されました。

AI モデルは常に正確であるとは限らないため、保存する前にコメントを確認する必要があります。 Databricks では、不正確な点がないか確認するために、AI によって生成されたコメントを人間が確認することを強く推奨しています。 このモデルは、PII を含む列の検出などのデータ分類タスクには依存しないでください。

テーブルに対する「 USE SCHEMA 」および「 SELECT 」権限を持つユーザーは、追加されたコメントを表示できます。

コメントの提案を生成するために使用されるモデルに関する情報については、 「 AIで生成されたテーブル コメントに関するよくある質問」を参照してください。

始める前に

AI 生成コメントを使用する前に、ワークスペースで AI 支援機能を有効にする必要があります。 ほとんどのワークスペースでは、これはデフォルトで有効になっています。 ただし、ワークスペースでコンプライアンス セキュリティ プロファイルを使用している場合は、ワークスペース管理者がパートナーが提供する AI 支援機能を有効にする必要があります。

  1. 「設定」で、 「詳細設定」タブに移動し、 「その他」セクションまで下にスクロールします。

  2. パートナーによる AI 支援機能オプションをオンにします。

AIが生成したコメントを追加する

カタログエクスプローラーを使用して、提案されたコメントを表示、編集し、テーブルや列に追加する必要があります。

必要な権限: AI が提案したコメントを表示、編集、追加するには、テーブルの所有者であるか、テーブルに対するMODIFY権限を持っている必要があります。

AIが提案したコメントをテーブルに追加する

  1. Databricksワークスペースで、カタログ アイコンカタログ

  2. テーブルを検索または参照して選択します。

  3. 「このテーブルについて」パネルの「AI 推奨コメント」フィールドを表示します。

    AI生成のコメント編集フィールド

    AI がコメントを生成するのに少し時間がかかる場合があります。

  4. 「承諾」をクリックしてコメントをそのまま受け入れるか、「編集」をクリックしてコメントを変更する前に保存します。

AIが提案したコメントを列に追加する

  1. Databricksワークスペースで、カタログ アイコンカタログ

  2. テーブルを検索または参照して選択します。

  3. 表の列見出しの上にあるAI 生成ボタンをクリックします。

    各列にコメントが生成されます。

  4. 列のコメントの横にあるチェックマークをクリックして、コメントを受け入れるか、保存せずに閉じます。

AI生成コメントを更新する

テーブル所有者またはテーブルに対するMODIFY権限を持つユーザーは、カタログ エクスプローラー UI または SQL コマンド ( ALTER TABLEまたはCOMMENT ON ) を使用して、いつでもテーブルと列のコメントを更新できます。

AI が生成したテーブル コメントに関してよく寄せられる質問

このセクションでは、AI が生成したテーブル コメント (AI が生成したドキュメントとも呼ばれます) に関する一般的な情報を、FAQ形式で提供します。

AI 生成ドキュメント機能はどのようなサービスを使用しますか?

コンプライアンス セキュリティ プロファイルが有効になっているワークスペースでは、AI によって生成されたコメントは外部のモデル パートナーを使用して応答を提供する場合があります。

AWS 上の他のすべてのワークスペースでは、AI 生成コメントは内部の大規模言語モデル (LLM) を使用します。

モデルが内部モデルか外部モデルかにかかわらず、これらのモデルに送信されたデータはモデルのトレーニングには使用されません。 モデル自体はステートレスであり、プロンプトや入力候補はモデルプロバイダーによって保存されません。

モデルサービングエンドポイントはどのリージョンでホストされていますか?

欧州連合 (EU) のデータは EU にとどまります。 外部パートナー モデルの場合、欧州連合 (EU) ワークスペースは EU でホストされている外部モデルを使用します。 他のすべてのリージョンでは、米国でホストされている外部モデルが使用されます。 内部 Databricks モデルの場合、欧州連合 (EU) ワークスペースはeu-west-1でホストされているモデルを使用します。 他のすべてのトラフィックは、パブリック プレビュー中に us-west-2 リージョンに送信されます。

Databricks と外部モデル パートナー間でデータはどのように暗号化されますか?

Databricks と外部モデル パートナー間のトラフィックは、業界標準の TLS 1.2 暗号化を使用して転送中に暗号化されます。

保存時にすべてが暗号化されますか?

Databricks ワークスペース内に保存されるすべてのデータは、AES-256 ビットで暗号化されます。 当社の外部パートナーは、送信されたプロンプトや完了内容を一切保存しません。

モデルにはどのようなデータが送信されますか?

Databricks は、各 API リクエストで次のメタデータをモデルに送信します。

  • テーブル スキーマ (カタログ名、スキーマ名、テーブル名、現在のコメント)

  • 列名 (列名、型、主キーかどうか、現在の列のコメント)

承認されたテーブルまたは列のコメントは、Unity Catalog の残りのメタデータとともに、Databricks コントロール プレーン データベースに保存されます。 コントロール プレーン データベースは AES-256 ビットで暗号化されています。