メインコンテンツまでスキップ

Genieスペースのコンセプト

Genieスペースは、ビジネスチームが自然言語を使用してデータと対話できるDatabricksの機能です。ドメイン専門家は、Genieスペースをデータセット、サンプルクエリ、テキストガイドラインで構成し、Genieがビジネス上の質問を分析クエリに翻訳するのを支援します。セットアップ後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして、運用データを理解できます。Databricks AI支援機能の詳細については、「Databricks AI支援機能」を参照してください。

Genie は、注釈が付けられたテーブルと列から関連する名前と説明を選択し、自然言語の質問を同等の SQL クエリに変換します。生成されたクエリと結果テーブル (可能な場合) で応答します。Genieが回答を生成できない場合、回答を提供する前にフォローアップの質問をして明確にすることができます。

使用例

営業マネージャーは、自身のベーカリーにおいて、時系列で最も売れている製品を把握したいと考えています。自然言語を使用してGenieスペースと対話し、視覚化を自動的に生成できます。

次のgifはこのインタラクションを示しています。

質問、回答、自動生成されたビジュアライゼーションを含むGif

Genieスペースのしくみ

Genieスペースは複合 AI システムを利用してビジネス上の疑問を解釈し、回答を生成します。単一の大規模言語モデルを使用する代わりに、複合AIシステムは、複数の相互作用するコンポーネントを組み合わせることによってAIアプリケーションでタスクを処理します。複合AIシステムは、そのパフォーマンスと柔軟性により、AIアプリケーションの設計パターンとしてますます一般的になっています。詳細については、「 モデルから複合 AI システムへのシフト 」を参照してください。

主要な概念

コンセプト

説明

ナレッジストア

Genieによるデータの理解を深める厳選されたセマンティック定義のコレクション。知識ストアには、スペースレベルのテーブルと列の説明、同義語、結合関係、SQL式、およびプロンプト一致設定が含まれます。知識ストアの構成は、スペースにスコープが設定され、Unity Catalog のメタデータには影響しません。「ナレッジストアの構築」を参照してください。

手順

Genieがデータを解釈し、質問に回答するためのプレーンテキストの記述です。手順では、ビジネスルール、推奨される用語、日付形式、およびその他のドメイン固有のコンテキストについて説明できます。指示を提供するを参照してください。

SQL クエリの例

一般的な質問の参考回答となるSQLクエリ。GenieはGenieスペースのクエリライブラリから関連する例を賢く選択し、より正確な応答を生成します。パラメータ化されたサンプルクエリまたはSQL関数の正確なテキストを使用して応答が生成されると、Genie は応答を 信頼済み としてマークします。SQL クエリと関数の例の追加を参照してください。

信頼できるアセット

スペース作成者により正確なロジックが検証済みの、パラメータ化されたサンプルクエリおよびSQL関数。Genie が信頼できるアセットを使用して応答を生成すると、その結果が検証済みクエリから得られたものであることを示すために、 信頼済み バッジが表示されます。応答を確認するを参照してください。

ベンチマーク

Genie Spaceの回答精度を評価および測定するための一連のテスト問題指示とは異なり、ベンチマークは評価のみを目的としています。Genieは、コンテキストを改善するためにベンチマークの質問やSQLを使用しません。ベンチマークを参照してください。

エージェントモード

データ全体にわたり、より深い分析を実行する多段階推論モードです。エージェントモードは、複雑な質問をサブタスクに分解し、複数のSQLクエリを実行し、検出結果と視覚化を含む構造化されたレポートを返します。Genieスペースのエージェントモードを参照してください。

どのようなデータを使用できますか?

Genie Space は、マネージドテーブル、外部テーブル、フォーリンテーブル、ビュー、メトリックビュー、マテリアライズドビューなど、Unity Catalog に登録されたデータに基づいています。Genieは、Unity Catalogオブジェクトに添付されたメタデータ、および作成者によって厳選されたスペースレベルのナレッジストアを使用して、応答を生成します。適切に注釈が付けられたデータセットと、提供する具体的な指示を組み合わせることが、エンドユーザーにとって好ましいエクスペリエンスを生み出す鍵となります。

注記

Genieは**構造化データのみ**で動作します。PDF、Word文書、またはその他のファイルベースのコンテンツなどの非構造化データに関する質問には回答できません。Genieが非構造化ドキュメントにアクセスできるようにするには、GoogleドライブやSharePointなどの外部ドキュメントソースに接続できるGenieのチャットを使用します。

Genieスペースはどのように応答を生成しますか?

ユーザーが質問を送信すると、Genie はリクエストを解析し、関連するデータソースを特定し、適切な応答を生成する方法を決定します。著者によって提供される詳細と、関連するUnity Catalogのコメント、メタデータ、および選択された列からのサンプル値とを組み合わせることで、Genieはビジネスロジックと技術ロジックの両方を推測できるようになります。Genieは、SQLクエリの例、テーブルと列のメタデータ、およびチャット履歴からインテリジェントにフィルタリングし、リクエストへの回答に最も関連性の高いコンテキストを選択します。

Genieは次のコンポーネントを使用して回答を生成します:

コンポーネント

説明

Unity Catalogテーブルのメタデータ

テーブル名、説明、および定義された主キー(PK)と外部キー(FK)の関係。Genieは、このデータを使用して、自然言語プロンプトをSQLに変換します。

列の名前と説明

Genieは関連する列名と説明をインテリジェントにフィルタリングします。

ナレッジストアコンテキスト

作成者がローカルで追加する、クエリー生成に関連する列の値を含むスペース固有のメタデータ。既存のUnity Catalogメタデータは変更されません。「ナレッジストアの構築」を参照してください。

SQL クエリの例

Genieは、 SQLクエリー から関連するSQLの例を適切に選択します。

SQL関数

すべてのSQL関数がスペースに追加されました。

手順

一般的な指示 として提供されるプレーンテキストのメモ。

プロンプトとレスポンスの履歴

現在のチャットのプロンプトとレスポンス必要に応じて、設定されたトークン制限のため、チャット履歴の最も古い部分は除外されます。

注記

オーナーやテーブルサイズなど、一部のテーブルの詳細は、デフォルトでは含まれていません。この情報にアクセスするには、すべてのUnity Catalogカタログで利用可能な情報スキーマからビューを使用します。情報スキーマで利用可能な情報の詳細については、「情報スキーマ」を参照してください。

ほとんどの場合、Genieは、スペースのSQLウェアハウスで実行されるSQLクエリーを生成します。生成されたクエリは常に読み取り専用です。再試行は自動的に管理され、SQLウェアハウスは並行処理とスケーリングを管理します。Genieがセキュリティとプライバシーを維持する方法の詳細については、「Databricks AI 支援機能の信頼性と安全性」を参照してください。

Inspect を使用して応答の正確性を向上

備考

プレビュー

この機能は パブリック プレビュー段階です。

Inspectは、Genieが生成したSQLクエリの精度をレビューし、向上させるために、高度な推論を使用します。応答の検査を有効にすると、Genie:

  1. 最初に生成された SQL クエリを確認します。

  2. クエリの特定の側面を検証するために、以下のようなより小さなSQLステートメントを作成します:

    • 正しいフィルター値が含まれていることを確認します。
    • 日付範囲ロジックの検証、例えば過去7日間のウィンドウなど。
    • 結合条件と集計を確認中
  3. 元のクエリでギャップまたは潜在的な問題を特定します。

  4. 問題が特定された場合、それらを解決する改善された SQL クエリを生成します。

  5. 元のクエリと改善後のクエリを最終比較します。

  6. 質問に最も正確に答えるクエリを返します。

クエリの正確性についてさらに確信を持ちたい場合、特にフィルター、日付範囲、または複数のテーブルが関わる複雑なクエリの場合は、Inspectを使用してください。

対応言語

ポルトガル語やフランス語などの英語以外の言語でGenieスペースを利用できます。ただし、基盤となるエージェントフレームワークは、プロンプトを英語でラップします。

Databricks は、スペース作成者が選択した言語でできるだけ多くのメタデータを追加することを推奨します。Genieの回答は、基盤となるシステムプロンプトにより、英語で表示されることがあります。

データアクセスの仕組み

GenieスペースにおけるデータアクセスはUnity Catalogによって管理されます。ユーザーが質問すると、生成されたSQLクエリは、スペース作成者によって埋め込まれたコンピュート資格情報(構成済みのSQLウェアハウス)を使用して、データに対して実行されます。各自の固有の Unity Catalog データ権限がクエリ結果に適用されます。アクセスが許可されているデータのみが表示されます。アクセスできないデータに関する質問では、空の応答が返されます。

これはですね:

  • ユーザーに直接のウェアハウス権限を付与する必要はありません。
  • Unity Catalogで定義された行フィルターと列マスクは、ユーザーごとに自動的に適用されます。
  • ユーザーごとのデータフィルタリングを実装するには、Unity Catalog の基になるテーブルに行レベルセキュリティを適用してください。「行フィルターと列マスク」を参照してください。

Genieスペースのユーザー権限の設定に関する情報については、Genieスペースを共有するを参照してください。プライバシーとセキュリティに関するFAQについては、「プライバシーとセキュリティに関するFAQ」を参照してください。

次のステップ