メインコンテンツまでスキップ

Genieスペースとは

このページでは、ビジネス チームが自然言語を使用してデータと対話できるようにする Databricks 機能である Genie を紹介します。組織の用語とデータに合わせてカスタマイズされた生成AIを使用し、ユーザーからのフィードバックを通じてパフォーマンスを監視および改善する機能を備えています。

概要

データ アナリストなどのドメインの専門家は、 Genieビジネスの質問を分析クエリに変換できるように、データセット、サンプル クエリ、およびテキスト ガイドラインを使用してGenie spaces構成します。 セットアップ後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして運用データを理解できるようになります。データが変更されたり、ユーザーが新しい質問をしたりすると、Genie のセマンティック知識を継続的に更新できます。Databricks AIを利用した機能の詳細については、 Databricks AI支援機能」を参照してください。

Genie は、注釈付きのテーブルと列から関連する名前と説明を選択し、自然言語の質問を同等の SQL クエリに変換します。次に、可能であれば、生成されたクエリと結果テーブルで応答します。Genie が回答を生成できない場合は、回答を提供する前に、明確にするために追加の質問をすることができます。

使用例

さまざまな非技術者層に対応するために、さまざまなGenieスペースを作成できます。次のシナリオでは、考えられる 2 つのユース ケースについて説明します。

例 1: 売れ筋製品の可視化

営業マネージャーは、パン屋で最も売れている製品を長期にわたって把握したいと考えています。 自然言語を使用してGenie Space と対話し、視覚化を自動的に生成できます。

次のgifはこのインタラクションを示しています。

質問、回答、自動生成されたビジュアライゼーションを含むGif

例 2: 物流の追跡

物流会社は、さまざまな部門のビジネス ユーザーが業務および財務の詳細を追跡できるように、Genieスペースを使用したいと考えています。彼らは、出荷施設の管理者が出荷を追跡するためのGenieスペースと、財務担当役員が財務状況を把握するための Genieスペースを設置しました。

どのデータを使用すべきですか?

Genieスペースは、マネージドテーブル、外部テーブル、フォーリンテーブル、ビュー、メトリクスビュー、マテリアライズドビューなど、 Unity Catalogに登録されたデータに基づいています。 Genie は、Unity Catalog オブジェクトに添付されたメタデータと、作成者によってキュレートされた空間レベルの知識ストアを使用して応答を生成します。適切に注釈が付けられたデータセットと、提供する具体的な指示を組み合わせることで、エンドユーザーにとって肯定的なエクスペリエンスを生み出す鍵となります。

ファイルのアップロード

備考

プレビュー

この機能は パブリック プレビュー段階です。

ファイルのアップロードにより、ユーザーはローカルの CSV ファイルや Excel ファイルを Unity Catalog のデータとブレンドして、質問に答えることができます。ファイルのアップロードを有効にするには、Databricks アカウント チームにお問い合わせください。詳細については、「 ファイルのアップロード」を参照してください。

Genieの仕組み

Genieは、 複合AIシステム を使用してビジネス上の質問を解釈し、回答を生成します。 複合 AI システムは、単一の大規模言語モデルを使用するのではなく、複数の相互作用するコンポーネントを組み合わせて、 AI アプリケーションのタスクを処理します。 複合AIシステムは、そのパフォーマンスと柔軟性から、AIアプリケーションの設計パターンとしてますます一般的になっています。 詳細については、 モデルから複合 AI システムへの移行を参照してください。

言語サポート

Genie は、ポルトガル語やフランス語など、英語以外の言語でも使用できます。ただし、基盤となるエージェント フレームワークでは、プロンプトが英語でラップされます。

Databricks では、スペース作成者が選択した言語で可能な限り多くのメタデータを追加することを推奨しています。基礎となるシステムプロンプトにより、Genie の応答が英語で表示される場合があります。

Genieのナレッジストアとは何ですか?

Genie のナレッジストアを使用すると、作成者は次のことができます。

  • メタデータをローカルで編集: Genie の作成者は、データ アセットにスペース固有のメタデータを追加できます。たとえば、スペースの使用方法に関連する会社固有の情報を含めることができます。これには、テーブルと列のメタデータの説明、列レベルの同義語、およびプロンプト一致機能が含まれており、Genie は回答を生成するときにこれらを参照します。詳細なメタデータ レイヤーは、Genie が正しい情報を取得し、より正確な結果を生成するのに役立ちます。

  • 構造化されたきめ細かな指示を提供します。 作成者は、テーブル間のJOIN関係を定義して、複数のテーブルにまたがるSQLを作成する方法をGenieに教えることができます。

より信頼性の高いGenie spacesについては、「ナレッジ ストアの構築」を参照してください。

Genieはどのように応答を生成しますか?

ユーザーが質問を送信すると、 Genieリクエストを解析し、関連するデータソースを識別し、適切な応答を生成する方法を決定します。 作成者によって提供された詳細と、関連するUnity Catalogコメント、メタデータ、および選択された列のサンプル値を組み合わせることで、 Genieビジネス ロジックと技術ロジックの両方を推測できます。 詳細については、 Databricks AI支援機能の信頼性と安全性およびプロンプト マッチング」を参照してください。 Genie は、サンプル SQL クエリ、テーブルと列のメタデータ、チャット履歴をインテリジェントにフィルタリングし、リクエストに応答するための最も関連性の高いコンテキストを選択します。

Genie は次のようなコンポーネントを使用して応答を生成します。

  • Unity Catalog テーブルのメタデータ : テーブルの名前、説明、定義済みの主キー (PK) と外部キー (FK) のリレーションシップが含まれます。Genie は、このデータを使用して要求を解析し、自然言語プロンプトを SQL に変換します。
  • 列の名前と説明 : Genie は、関連する列の名前と説明を含めるようにインテリジェントにフィルタリングします。
  • ナレッジ ストアのコンテキスト : 作成者はアセット メタデータをローカルで編集し、Genie に関連する値を提供する列を選択できます。これにより、Genie はより正確な応答を生成できるようになり、既存の Unity Catalog メタデータは変更されません。より信頼性の高いGenie spacesについては、「ナレッジ ストアの構築」を参照してください。
  • SQLクエリの例 :Genie は、SQLクエリ から関連するSQLの例をインテリジェントに選択します。
  • SQL 関数 : スペースに追加されたすべての SQL 関数。
  • 手順 : 一般的な手順 として提供されるプレーンテキストのメモは、コンテキストとして含まれています。
  • プロンプトと応答の履歴 : 現在のチャットからのプロンプトと応答は、コンテキストとして含まれます。 必要に応じて、 トークンの制限が設定されているため、チャットレコードの最も古い部分が除外されます。
注記

所有者やテーブルサイズなど、一部のテーブルの詳細はデフォルトでは含まれていません。この情報にアクセスするには、すべての Unity Catalog カタログで使用できる情報スキーマのビューを使用します。デフォルト ビューには不要な詳細が含まれている可能性があるため、その上にカスタム ビューを作成すると、必要な特定の情報に集中するのに役立ちます。 情報スキーマで使用できる機能の詳細については、「 情報スキーマ」を参照してください。

多くの場合、Genie はスペースの SQLウェアハウスで実行される SQL クエリを生成します。生成されたクエリは常に読み取り専用です。再試行は自動的に処理され、 SQLウェアハウスは同時実行性とスケールを処理します。 結果セットは、応答の一部として表示されます。

Genie は強力なセキュリティとプライバシー管理を維持しています。詳細については、 Databricks AI 支援機能の信頼性と安全性を参照してください。

Inspectを使用して応答精度を向上させる

備考

プレビュー

この機能は パブリック プレビュー段階です。

Inspectは高度な推論を用いて、Genieが生成したSQLクエリの精度を検証し、向上させます。レスポンスの検査を有効にすると、Genie は次のようになります。

  1. 最初に生成された SQL クエリを確認します。

  2. 次のようなクエリの特定の側面を検証するための小さな SQL ステートメントを作成します。

    • 正しいフィルター値が含まれていることを確認します。
    • 末尾の 7 日間のウィンドウなどの日付範囲ロジックを検証します。
    • 結合条件と集計をチェックしています。
  3. 元のクエリ内のギャップまたは潜在的な問題を特定します。

  4. 問題が特定された場合は、それを解決する改善された SQL クエリを生成します。

  5. 元のクエリと改善されたクエリの最終的な比較を実行します。

  6. 質問に最も正確に答えるクエリを返します。

クエリの精度に対する信頼性をさらに高めたい場合、特にフィルター、日付範囲、または複数のテーブルを含む複雑なクエリの場合に、検査機能を使用してください。

Genieスペースを設定する

以下のものがあればGenieスペースを作成できます。

  • Databricks SQL エンタイトルメント。
  • 少なくとも CAN USE 許可は、プロまたはサーバレス SQLウェアハウスで使用できます。
  • 1 つ以上のUnity Catalogデータ オブジェクトに対する少なくともSELECT権限。

Genieスペースのセットアップと管理」を参照してください。

AI/BIダッシュボード用のコンパニオンGenie spaces (パブリック プレビュー)

Genie Code では、自然言語プロンプトを使用して AI/BI ダッシュボードの視覚化を生成できます。ダッシュボードの作成には Genie Code を使用するを参照してください。

ダッシュボードを作成すると、 DatabricksによってコンパニオンGenieスペースが自動的に作成され、ビジネス ユーザーが自然言語を使用してセルフサービスのデータ分析を実行できるようになります。 ダッシュボード付きのGenie spacesを参照してください。

Genieスペースと対話する

ビジネスチームは、Genieスペースのエンドユーザーです。Genieスペースを使用するには、ビジネスユーザーが以下を持っている必要があります。

  • コンシューマー アクセスまたは Databricks SQL エンタイトルメント。
  • スペースで使用されるすべてのUnity Catalogデータ オブジェクトに対する少なくともSELECT権限。 ユーザーには、アクセス権限のあるデータのみが表示されます。

ウェアハウスを構成した作成者によって埋め込まれたコンピュート資格情報を使用してクエリを実行します。 エンドユーザーは直接ウェアハウス権限を必要としません。

ビジネス ユーザーは、スペースをテストし、開発中にフィードバックを提供することで、スペースのキュレーションを支援できます。ビジネス ユーザーがGenieスペースの使用を開始する方法の詳細については、「Genieスペースを使用してビジネス データを探索する」を参照してください。

信頼できる資産

信頼できる資産は、宇宙利用者に対して、結果の正確性に関するさらなる安心感を与える。パラメータ化されたサンプルクエリまたは SQL 関数の正確なテキストを使用して応答を生成すると、Genie はその応答を 信頼済み としてマークします。信頼できるアセットとパラメータ化クエリの操作方法の詳細については、 「信頼できるアセット」を参照してください。

ベンチマークによる回答の評価

ベンチマークを使用すると、Genieスペースでの個々の回答のテストと評価をスケールアップできます。指示とは異なり、ベンチマークはGenieスペースを評価するためのものであり、情報を提供するものではありません。Genieは、Genieのコンテキストを改善するためにベンチマーク質問やサンプルSQLを使用しません。

ベンチマークを使用して、テスト問題のコレクションを実行し、その回答を使用して Genie の精度を測定できます。オプションで、予期される結果を返す SQL ステートメントを含めることができます。ベンチマークの質問が実行されると、Genieの応答がSQLステートメントによって提供される結果と比較され、精度がスコアリングされます。SQL の回答が提供されていない場合、質問はレビュー対象としてマークされます。

Genieスペースでのベンチマークの使用を参照してください。

プライバシーとセキュリティ

Genieスペース内のデータ アクセスは、テーブルに適用されている行フィルターや列マスクなど、 Unity Catalogによって管理されます。 「データ アクセス制御」および「行フィルターと列マスク」を参照してください。

プライバシーとセキュリティに関するその他の FAQ については、 AI 支援機能のプライバシーとセキュリティに関する FAQ を参照してください。