Genieスペースとは何ですか?
このページでは、Databricksの機能であるGenie Spacesを紹介します。Genie Spacesを使用すると、ビジネスチームは自然言語を使ってデータとやり取りできます。組織の用語やデータに合わせてカスタマイズされたAIを生成し、ユーザーからのフィードバックを通じてそのパフォーマンスを監視・改善する機能を備えています。
概要
データアナリストなどのドメインエキスパートは、データセット、サンプルクエリ、テキストガイドラインを使用してGenie Spacesを設定し、Genieがビジネス上の質問を分析クエリに変換できるようにします。設定後、ビジネスユーザーは質問をしたり、運用データを理解するための視覚化を作成したりすることができます。データが変更されたり、ユーザーが新しい質問をしたりするたびに、Genieのセマンティック知識を継続的に更新できます。Databricks AIを活用した機能に関する詳細については、 Databricks AI支援機能」を参照してください。
Genie は、注釈付きのテーブルと列から関連する名前と説明を選択し、自然言語の質問を同等の SQL クエリに変換します。次に、可能であれば、生成されたクエリと結果テーブルで応答します。Genie が回答を生成できない場合は、回答を提供する前に、明確にするために追加の質問をすることができます。
使用例
さまざまな非技術者層に対応するために、さまざまなGenieスペースを作成できます。次のシナリオでは、考えられる 2 つのユース ケースについて説明します。
例 1: 売れ筋製品の可視化
営業マネージャーは、自社のパン屋における売れ筋商品の推移を把握したいと考えています。 パン屋における売れ筋商品の推移を把握したいと考えています。 彼らは自然言語を使ってGenie Spaceと対話し、自動的に視覚化を生成することができる。
次のgifはこのインタラクションを示しています。

例 2: 物流の追跡
物流会社は、さまざまな部門のビジネス ユーザーが業務および財務の詳細を追跡できるように、Genieスペースを使用したいと考えています。彼らは、出荷施設の管理者が出荷を追跡するためのGenieスペースと、財務担当役員が財務状況を把握するための Genieスペースを設置しました。
どのデータを使用すべきですか?
Genie Space は、マネージドテーブル、外部テーブル、フォーリンテーブル、ビュー、メトリクス ビュー、マテリアライズドビューなど、 Unity Catalogに登録されたデータに基づいています。 Genie 、 Unity Catalogオブジェクトに添付されたメタデータと、作成者がキュレーションした宇宙レベルの知識ストアを利用して応答を生成します。 適切に注釈が付けられたデータセットと、あなたが提供する具体的な指示を組み合わせることが、エンドユーザーにとって良好な体験を生み出す鍵となります。
Genieは 構造化データ のみを扱います。PDF、Word文書、その他のファイルベースのコンテンツといった非構造化データに関する質問には回答できません。Genieに非構造化ドキュメントへのアクセスを許可するには、 Genieのチャット機能を使用します。チャット機能は、GoogleドライブやSharePointなどの外部ドキュメントソースに接続できます。
ファイルのアップロード
プレビュー
この機能は パブリック プレビュー段階です。
ファイルのアップロードにより、ユーザーはローカルの CSV ファイルや Excel ファイルを Unity Catalog のデータとブレンドして、質問に答えることができます。ファイルのアップロードを有効にするには、Databricks アカウント チームにお問い合わせください。詳細については、「 ファイルのアップロード」を参照してください。
Genieの仕組み
Genieは、 複合AIシステム を使用してビジネス上の質問を解釈し、回答を生成します。 複合 AI システムは、単一の大規模言語モデルを使用するのではなく、複数の相互作用するコンポーネントを組み合わせて、 AI アプリケーションのタスクを処理します。 複合AIシステムは、そのパフォーマンスと柔軟性から、AIアプリケーションの設計パターンとしてますます一般的になっています。 詳細については、 モデルから複合 AI システムへの移行を参照してください。
言語サポート
Genie は、ポルトガル語やフランス語など、英語以外の言語でも使用できます。ただし、基盤となるエージェント フレームワークでは、プロンプトが英語でラップされます。
Databricks では、スペース作成者が選択した言語で可能な限り多くのメタデータを追加することを推奨しています。基礎となるシステムプロンプトにより、Genie の応答が英語で表示される場合があります。
Genieのナレッジストアとは何ですか?
Genie のナレッジストアを使用すると、作成者は次のことができます。
-
メタデータをローカルで編集: Genie の作成者は、データ アセットにスペース固有のメタデータを追加できます。たとえば、スペースの使用方法に関連する会社固有の情報を含めることができます。これには、テーブルと列のメタデータの説明、列レベルの同義語、およびプロンプト一致機能が含まれており、Genie は回答を生成するときにこれらを参照します。詳細なメタデータ レイヤーは、Genie が正しい情報を取得し、より正確な結果を生成するのに役立ちます。
-
構造化されたきめ細かな指示を提供します。 作成者は、テーブル間のJOIN関係を定義して、複数のテーブルにまたがるSQLを作成する方法をGenieに教えることができます。
「より信頼性の高いGenieスペースのためのナレッジストアの構築」を参照してください。
Genieはどのように応答を生成しますか?
ユーザーが質問を送信すると、 Genieリクエストを解析し、関連するデータソースを識別し、適切な応答を生成する方法を決定します。 作成者によって提供された詳細と、関連するUnity Catalogコメント、メタデータ、および選択された列のサンプル値を組み合わせることで、 Genieビジネス ロジックと技術ロジックの両方を推測できます。 詳細については、 Databricks AI支援機能の信頼性と安全性およびプロンプト マッチング」を参照してください。 Genie は、サンプル SQL クエリ、テーブルと列のメタデータ、チャット履歴をインテリジェントにフィルタリングし、リクエストに応答するための最も関連性の高いコンテキストを選択します。
Genie は次のようなコンポーネントを使用して応答を生成します。
- Unity Catalog テーブルのメタデータ : テーブルの名前、説明、定義済みの主キー (PK) と外部キー (FK) のリレーションシップが含まれます。Genie は、このデータを使用して要求を解析し、自然言語プロンプトを SQL に変換します。
- 列の名前と説明 : Genie は、関連する列の名前と説明を含めるようにインテリジェントにフィルタリングします。
- ナレッジストアのコンテキスト :作成者は、アセットのメタデータをローカルで編集し、Genieに関連する値を提供する列を選択できます。これにより、 Genieより正確な応答を生成できるようになり、既存のUnity Catalogメタデータは変更されません。 より信頼性の高い Genie Spaces を構築するには、「知識ストアを構築する」を参照してください。
- SQLクエリの例 :Genie は、SQLクエリ から関連するSQLの例をインテリジェントに選択します。
- SQL 関数 : スペースに追加されたすべての SQL 関数。
- 手順 : 一般的な手順 として提供されるプレーンテキストのメモは、コンテキストとして含まれています。
- プロンプトと応答の履歴 : 現在のチャットからのプロンプトと応答は、コンテキストとして含まれます。 必要に応じて、 トークンの制限が設定されているため、チャットレコードの最も古い部分が除外されます。
所有者やテーブルサイズなど、一部のテーブルの詳細はデフォルトでは含まれていません。この情報にアクセスするには、すべての Unity Catalog カタログで使用できる情報スキーマのビューを使用します。デフォルト ビューには不要な詳細が含まれている可能性があるため、その上にカスタム ビューを作成すると、必要な特定の情報に集中するのに役立ちます。 情報スキーマで使用できる機能の詳細については、「 情報スキーマ」を参照してください。
多くの場合、Genie はスペースの SQLウェアハウスで実行される SQL クエリを生成します。生成されたクエリは常に読み取り専用です。再試行は自動的に処理され、 SQLウェアハウスは同時実行性とスケールを処理します。 結果セットは、応答の一部として表示されます。
Genie は強力なセキュリティとプライバシー管理を維持しています。詳細については、 Databricks AI 支援機能の信頼性と安全性を参照してください。
Inspectを使用して応答精度を向上させる
プレビュー
この機能は パブリック プレビュー段階です。
Inspectは高度な推論を用いて、Genieが生成したSQLクエリの精度を検証し、向上させます。レスポンスの検査を有効にすると、Genie は次のようになります。
-
最初に生成された SQL クエリを確認します。
-
次のようなクエリの特定の側面を検証するための小さな SQL ステートメントを作成します。
- 正しいフィルター値が含まれていることを確認します。
- 末尾の 7 日間のウィンドウなどの日付範囲ロジックを検証します。
- 結合条件と集計をチェックしています。
-
元のクエリ内のギャップまたは潜在的な問題を特定します。
-
問題が特定された場合は、それを解決する改善された SQL クエリを生成します。
-
元のクエリと改善されたクエリの最終的な比較を実行します。
-
質問に最も正確に答えるクエリを返します。
クエリの精度に対する信頼性をさらに高めたい場合、特にフィルター、日付範囲、または複数のテーブルを含む複雑なクエリの場合に、検査機能を使用してください。
Genieスペースを設定する
以下のものがあれば、 Genieスペースを作成できます。
- Databricks SQL エンタイトルメント。
- 少なくとも CAN USE 許可は、プロまたはサーバレス SQLウェアハウスで使用できます。
- 1 つ以上のUnity Catalogデータ オブジェクトに対する少なくとも
SELECT権限。
Genie Spaceの設定と管理については、「Genie Spaceの設定と管理」を参照してください。
AI/BIダッシュボード向けコンパニオンGenie Spaces(パブリックプレビュー)
Genie Code では、自然言語プロンプトを使用して AI/BI ダッシュボードの視覚化を生成できます。ダッシュボードの作成には Genie Code を使用するを参照してください。
ダッシュボードを作成すると、Databricksは自動的に関連するGenie Spaceを作成し、ビジネスユーザーが自然言語を使用してセルフサービス型のデータ分析を実行できるようにします。ダッシュボードを備えたGenie Spacesをご覧ください。
Genieスペースと交流する
ビジネスチームは、Genie Spaceのエンドユーザーです。Genie Spaceを利用するには、ビジネスユーザーは以下の条件を満たしている必要があります。
- コンシューマー アクセスまたは Databricks SQL エンタイトルメント。
- スペースで使用されるすべてのUnity Catalogデータ オブジェクトに対する少なくとも
SELECT権限。 ユーザーには、アクセス権限のあるデータのみが表示されます。
ウェアハウスを構成した作成者によって埋め込まれたコンピュート資格情報を使用してクエリを実行します。 エンドユーザーは直接ウェアハウス権限を必要としません。
ビジネスユーザーは、開発段階でスペースをテストし、フィードバックを提供することで、スペースのキュレーションに貢献できます。ビジネスユーザーが Genie Space の利用を開始する方法の詳細については、 「Genie Space を使用してビジネスデータを探索する」を参照してください。
信頼できる資産
信頼できる資産は、宇宙利用者に対して、結果の正確性に関するさらなる安心感を与える。パラメータ化されたサンプルクエリまたは SQL 関数の正確なテキストを使用して応答を生成すると、Genie はその応答を 信頼済み としてマークします。信頼できるアセットとパラメータ化クエリの操作方法の詳細については、 「信頼できるアセット」を参照してください。
ベンチマークによる回答の評価
ベンチマークを使用すると、Genie Space 内で個々の応答のテストと評価を拡張できます。指示とは異なり、ベンチマークはGenie Spaceを評価するためのものであり、情報を提供するためのものではありません。Genieは、Genieのコンテキストを改善するために、ベンチマーク問題やSQLの例を使用しません。
ベンチマークを使用して、テスト問題のコレクションを実行し、その回答を使用して Genie の精度を測定できます。オプションで、予期される結果を返す SQL ステートメントを含めることができます。ベンチマークの質問が実行されると、Genieの応答がSQLステートメントによって提供される結果と比較され、精度がスコアリングされます。SQL の回答が提供されていない場合、質問はレビュー対象としてマークされます。
Genieスペースでベンチマークを使用するを参照してください。
データアクセスの仕組み
Genie Spaceにおけるデータアクセスは、Unity Catalogによって管理されます。ユーザーが質問すると、生成されたSQLクエリは、スペース作成者 (構成されたSQLウェアハウス) によって埋め込まれたコンピュート資格情報を使用してデータに対して実行されます。 クエリ結果には、各ユーザー固有のUnity Catalogデータ権限が適用されます。 ユーザーは、アクセス権限のあるデータのみを閲覧できます。アクセスできないデータに関する質問には、空の応答が返されます。
これはですね:
- ユーザーに直接ウェアハウス権限を付与する必要はありません。
- Unity Catalogで定義された行フィルターと列マスクは、ユーザーごとに自動的に適用されます。
- ユーザーごとのデータフィルタリングを実装するには、Unity Catalog の基となるテーブルに行レベルのセキュリティを適用します。行フィルターと列マスクを参照してください。
Genie Spaceのユーザー権限の設定方法については、 Genie Spaceを共有する」を参照してください。
プライバシーとセキュリティ
Genie Spaceにおけるデータアクセスは、テーブルに適用されている行フィルターや列マスクを含め、Unity Catalogによって管理されます。データアクセス制御、行フィルタ、列マスクを参照してください。
プライバシーとセキュリティに関するその他の FAQ については、 AI 支援機能のプライバシーとセキュリティに関する FAQ を参照してください。
その他のリソース
- Genie API を使用して Genie をアプリケーション、チャットボット、エージェントフレームワークに統合する方法については、 「Genie API を使用して Genie をアプリケーションに統合する」を参照してください。
- Genieのアクティビティと使用状況を追跡するために監査ログを使用する方法については、 「AI/BIの監査ログ」を参照してください。
- ベストプラクティスとトラブルシューティングについては、 「効果的なGenieスペースの構築」を参照してください。