メインコンテンツまでスキップ

AI/BI Genieスペースとは

このページでは、ビジネスチームが自然言語を使用してデータを操作できるようにするDatabricksの機能であるAI/BI Genieを紹介します。組織の用語とデータに合わせて調整された生成AI を使用し、ユーザーからのフィードバックを通じてパフォーマンスを監視および改善する機能を備えています。

概要

データ アナリストなどのドメインの専門家は、 Genieビジネスの質問を分析クエリに変換できるように、データセット、サンプル クエリ、およびテキスト ガイドラインを使用してGenie spacesを構成します。 セットアップ後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして運用データを理解できるようになります。データが変更されたり、ユーザーが新しい質問をしたりすると、Genie のセマンティック知識を継続的に更新できます。Databricks AIを利用した機能の詳細については、 Databricks AI支援機能」を参照してください。

AI/BI Genieは、注釈付きのテーブルと列から関連する名前と説明を選択して、自然言語の質問を同等のSQLクエリに変換します。次に、生成されたクエリと結果テーブル (可能な場合) で応答します。Genieが回答を生成できない場合は、回答を提供する前に、フォローアップの質問をして明確にすることができます。

使用例

さまざまな非技術者層に対応するために、さまざまなGenieスペースを作成できます。次のシナリオでは、考えられる 2 つのユース ケースについて説明します。

例 1: 営業案件の状態を視覚化する

営業マネージャーは、営業パイプラインのステージごとに、オープンおよびクローズ済みの商談の現在のステータスを取得したいと考えています。自然言語を使用してGenieスペースと対話し、視覚化を自動的に生成できます。

次のgifはこのインタラクションを示しています。

質問、回答、自動生成されたビジュアライゼーションを含むGif

例 2: 物流の追跡

物流会社は、さまざまな部門のビジネス ユーザーが業務および財務の詳細を追跡できるように、Genieスペースを使用したいと考えています。彼らは、出荷施設の管理者が出荷を追跡するためのGenieスペースと、財務担当役員が財務状況を把握するための Genieスペースを設置しました。

どのデータを使用すべきですか?

Genieスペースは、マネージドテーブル、外部テーブル、フォーリンテーブル、views、メトリクス views、マテリアライズドビューなど、Unity Catalogに登録されたデータに基づいています。AI/BI Genie は、Unity Catalog オブジェクトに添付されたメタデータと、作成者がキュレーションしたスペースレベルの ナレッジストアを使用して、レスポンスを生成します。適切に注釈が付けられたデータセットと、提供する特定の指示を組み合わせることで、エンドユーザーにポジティブなエクスペリエンスを提供するための鍵となります。

ファイルのアップロード

備考

プレビュー

この機能は パブリック プレビュー段階です。

ファイルのアップロードにより、ユーザーはローカルの CSV ファイルや Excel ファイルを Unity Catalog のデータとブレンドして、質問に答えることができます。ファイルのアップロードを有効にするには、Databricks アカウント チームにお問い合わせください。詳細については、「 ファイルのアップロード」を参照してください。

Genieの仕組み

Genieは、 複合AIシステム を使用してビジネス上の質問を解釈し、回答を生成します。 複合 AI システムは、単一の大規模言語モデルを使用するのではなく、複数の相互作用するコンポーネントを組み合わせて、 AI アプリケーションのタスクを処理します。 複合AIシステムは、そのパフォーマンスと柔軟性から、AIアプリケーションの設計パターンとしてますます一般的になっています。 詳細については、 モデルから複合 AI システムへの移行を参照してください。

Genieのナレッジストアとは何ですか?

Genie のナレッジストアを使用すると、作成者は次のことができます。

  • メタデータをローカルで編集します。 Genie 作成者は、スペース固有のメタデータをデータ資産に追加できます。たとえば、スペースの使用方法に関連する会社固有の情報を含めることができます。これには、テーブルと列のメタデータの説明、列レベルの同義語、サンプリングされた値、値ディクショナリが含まれ、Genie は回答を生成するときにこれらを参照します。詳細なメタデータレイヤーは、Genieが正しい情報を取得し、より正確な結果を生成するのに役立ちます。

  • 構造化されたきめ細かな指示を提供します。 作成者は、テーブル間のJOIN関係を定義して、複数のテーブルにまたがるSQLを作成する方法をGenieに教えることができます。

レッジ ストアの構築 を参照してください。

Genieはどのように応答を生成しますか?

ユーザーが質問を送信すると、 Genieリクエストを解析し、関連するデータソースを識別し、プロンプトに応答する方法を決定します。 作成者が提供する詳細と Unity Catalog のコメントおよびメタデータを組み合わせることで、Genie はビジネス ロジックと技術ロジックの両方を推測できます。Genie は、サンプル SQL クエリ、テーブルと列のメタデータ、チャット履歴をインテリジェントにフィルタリングし、リクエストに回答するために最も関連性の高い情報を選択します。

Genieは、次のコンポーネントを使用して応答を生成します。

  • Unity Catalog テーブルのメタデータ : テーブルの名前、説明、定義済みの主キー (PK) と外部キー (FK) のリレーションシップが含まれます。Genie は、このデータを使用して要求を解析し、自然言語プロンプトを SQL に変換します。
  • 列の名前と説明 : Genie は、関連する列の名前と説明を含めるようにインテリジェントにフィルタリングします。
  • ナレッジ ストアのコンテキスト : 作成者は、 Genieスペースで使用されるアセットのテーブル メタデータをローカルで編集できます。 これにより、Genie はより正確な応答を生成し、既存の Unity Catalog メタデータを変更せずに済みます。「AI/BI Genieスペースの設定と管理」を参照してください。
  • SQLクエリの例 :Genie は、SQLクエリ から関連するSQLの例をインテリジェントに選択します。
  • SQL 関数 : スペースに追加されたすべての SQL 関数。
  • 手順 : 一般的な手順 として提供されるプレーンテキストのメモは、コンテキストとして含まれています。
  • プロンプトと応答の履歴 : 現在のチャットからのプロンプトと応答は、コンテキストとして含まれます。 必要に応じて、 トークンの制限が設定されているため、チャットレコードの最も古い部分が除外されます。
注記

所有者やテーブルサイズなど、一部のテーブルの詳細はデフォルトでは含まれていません。この情報にアクセスするには、すべての Unity Catalog カタログで使用できる情報スキーマのビューを使用します。デフォルト ビューには不要な詳細が含まれている可能性があるため、その上にカスタム ビューを作成すると、必要な特定の情報に集中するのに役立ちます。 情報スキーマで使用できる機能の詳細については、「 情報スキーマ」を参照してください。

多くの場合、Genie はスペースの SQLウェアハウスで実行される SQL クエリを生成します。生成されたクエリは常に読み取り専用です。再試行は自動的に処理され、 SQLウェアハウスは同時実行性とスケールを処理します。 結果セットは、応答の一部として表示されます。

Genieスペースを設定する

次の場合は、 Genieスペースを作成できます。

  • Databricks SQL エンタイトルメント。
  • 少なくとも CAN USE 許可は、プロまたはサーバレス SQLウェアハウスで使用できます。
  • 1 つ以上の Unity Catalog データ オブジェクトに対する少なくとも SELECT つの特権。

AI/BI Genieスペースの設定と管理を参照してください。

AI/BIダッシュボード用のコンパニオンGenie spaces (パブリック プレビュー)

Databricks Assistant では、自然言語プロンプトを使用して AI/BI ダッシュボードの視覚化を生成できます。「Databricks Assistant を使用して視覚化を作成する」を参照してください。

ダッシュボードを作成すると、 DatabricksによってコンパニオンGenieスペースが自動的に作成され、ビジネス ユーザーが自然言語を使用してセルフサービスのデータ分析を実行できるようになります。 ダッシュボード付きのGenie spacesを参照してください。

Genieスペースと対話する

ビジネスチームは、Genieスペースのエンドユーザーです。Genieスペースを使用するには、ビジネスユーザーが以下を持っている必要があります。

  • コンシューマー アクセスまたは Databricks SQL エンタイトルメント。
  • 少なくとも、Genieスペースに指定されたデフォルトのウェアハウスに対するCAN USE許可。
  • スペースで使用されるすべての Unity Catalog データ オブジェクトに対する少なくとも SELECT つの特権。

ビジネス ユーザーは、スペースをテストし、開発中にフィードバックを提供することで、スペースのキュレーションを支援できます。ビジネス ユーザーがGenieスペースの使用を開始する方法の詳細については、「Genieスペースを使用してビジネス データを探索する」を参照してください。

信頼できる資産

信頼できるアセットは、結果の精度に対する追加の保証層をスペース ユーザーに伝えます。パラメータ化されたサンプルクエリまたは SQL 関数の正確なテキストを使用して応答を生成すると、Genie は応答を信頼できるものとしてマーク します 。信頼できる資産の詳細については、「AI/BI Genie spacesでの信頼できる資産の使用」を参照してください。パラメーター化されたクエリの操作の詳細については 、「 SQL クエリでパラメーターを使用する 」を参照してください。

ベンチマークによる回答の評価

ベンチマークを使用すると、Genieスペースでの個々の回答のテストと評価をスケールアップできます。指示とは異なり、ベンチマークはGenieスペースを評価するためのものであり、情報を提供するものではありません。Genieは、Genieのコンテキストを改善するためにベンチマーク質問やサンプルSQLを使用しません。

ベンチマークを使用して、テスト問題のコレクションを実行し、その回答を使用して Genie の精度を測定できます。オプションで、予期される結果を返す SQL ステートメントを含めることができます。ベンチマークの質問が実行されると、Genieの応答がSQLステートメントによって提供される結果と比較され、精度がスコアリングされます。SQL の回答が提供されていない場合、質問はレビュー対象としてマークされます。

Genieスペースでのベンチマークの使用を参照してください。

プライバシーとセキュリティ

プライバシーとセキュリティに関する FAQ については、 AI 支援機能のプライバシーとセキュリティに関する FAQ をご覧ください。