AI/BI Genieスペースの設定と管理
この記事では、ビジネスユーザーがデータについて自然言語で質問するためのチャットインターフェースであるGenieスペースを設定および管理する方法について説明します。
技術要件と制限
Genieスペースの使用には、次の要件と制限が適用されます。
- Unity Catalog: Genieスペースのデータは、 Unity Catalogに登録する必要があります。Genieスペースには、最大 25 個のテーブルまたはビューを追加できます。
- コンピュート: プロまたはサーバレス SQLウェアハウスを使用する必要があります。
- スループット: 各ワークスペースは、すべての Genieスペースで1分あたり最大20の質問を処理できます。
- 能力: 各 Genieスペースは最大 10,000 件の会話をサポートでき、各会話には最大 10,000 件のメッセージを含めることができます。
必要な権限
Genieスペースを作成、編集、および使用するには、次の権限が必要です。
- コンピュートの権限: Genieスペースの作成者、編集者、およびユーザーには、スペースに指定されたデフォルト SQLウェアハウスへの少なくとも CAN USE アクセス権が必要です。
- データ アクセス権限: スペースを操作するすべてのユーザーは、スペースで使用されるデータに対して少なくとも
SELECT
権限が必要です。 - Genieスペースの権限: Genieユーザーがスペースで使用されるGenie やデータを操作するには、 スペースに対するCAN RUN 権限が必要です。Genieスペースの権限と機能の完全なマッピングについては、Genieスペース ACLを参照してください。
データとコンピュート アクセスを構成するには、通常は管理者に限定された昇格されたアクセス許可が必要です。 SQLウェアハウスの作成およびUnity Catalogでの権限の管理を参照してください。
Genie アクセスの管理
Genieは、アカウントレベルで有効にする必要があるパートナー主導の支援機能を使用します。 アカウントでこれらの機能を管理する方法については、「 Databricks Assistant を有効にして試す」を参照してください。
この機能へのアクセスを管理するには、アカウント管理者である必要があります。 パートナーを利用した機能を無効にしても、 SQL エンタイトルメントを持つユーザーはサイドバーの Genie アイコンをクリックできますが、 Genieスペースにはアクセスできません。
Genieスペースを作成する
Genieスペースによってデータアナリストは、次の手順を実行して、ビジネスユーザー向けのドメイン固有の Genieスペースエクスペリエンスを作成できます。
-
サイドバーの Genie をクリックします。
-
画面の右上隅にある 新規 をクリックします。
-
Genieスペースに含めるデータソースを選択します。次に、「 作成 」をクリックします。
新しいスペースが作成されます。チャットに質問を入力して、スペースとの対話を開始します。
設定を構成する
追加の設定を構成して、Genieスペースをカスタマイズします。 「構成 」をクリックし、「 設定 」をクリックして、次の設定にアクセスします。
- タイトル : タイトルは、他のワークスペース オブジェクトとともにワークスペース ブラウザーに表示されます。エンドユーザーがGenieスペースを見つけるのに役立つタイトルを選択します。
- デフォルト ウェアハウス: このコンピュート リソース は、SQL で生成されるGenieスペースステートメントを強化します。エンドユーザーは、スペースを操作するためにこのウェアハウスにアクセスする必要があります。 Genieスペースでは、プロまたはサーバレス ウェアハウスSQL使用できます。最適なパフォーマンスを得るために、 Databricks はサーバレス SQLウェアハウスを使用することをお勧めします。
- 説明 : ユーザーが Genieスペースを開くと、説明が表示されます。 このテキスト領域を使用して、スペースの目的を説明します。 説明フィールドは Markdown の書式設定をサポートしているため、テキストのスタイルを設定し、役立つコンテキストや参照へのリンクを提供できます。 マークダウン構文の詳細については、 このガイドを参照してください。
- 質問サンプル :質問サンプルは任意です。チャットに表示され、ユーザーが質問できるタイプの例を提供します。作成中に追加することも、後でスペースの 設定 から追加することもできます。
Genieスペースでは、テストと使用に基づいて反復処理を行うことを想定してください。スペースの作成とイテレーションのベスト プラクティスに関するガイダンスについては、「 効果的な Genieスペースのキュレーション」を参照してください。
コンテキストの追加
Genie は、Unity Catalog メタデータ、Unity Catalog 関数、命令、およびサンプル SQL クエリを使用して、応答の生成を支援します。 「構成 」をクリックしてエディターを開きます。 [コンテキスト ] タブには、使用可能な データ 、 手順 、および SQLクエリ を表示するタブが含まれています。 [SQL クエリ] タブを使用して、クエリと Unity Catalog 関数を管理します。
データの管理
[データ ] タブには、回答の提供に使用されたデータ テーブルが表示されます。 「追加 」ボタンをクリックして、さらにテーブルを追加します。テーブル名の右側にある [ごみ箱] アイコンをクリックして、スペースからテーブルを削除します。
指示を提供する
「指示」 タブをクリックして、Genieがあなたのビジネスに関する特定の質問にどのように答えるかを理解するのに役立つプレーンテキストの指示を書きます。指示を 1 つの包括的なメモとして書式設定したり、トピックごとに分類して整理しやすくしたりできます。
指示は、Genieが特定のドメインで独自の専門用語、ロジック、および概念を処理できるように、Genieの応答をガイドするのに役立ちます。包括的な指示は、シームレスで直感的な Genieスペースエクスペリエンスに不可欠です。
次の例は、一般的な手順に含めることができる情報を示しています。
-
会社固有のビジネス情報 :
- 「私たちの会計年度は2月に始まります」
-
値、エイリアス、または共通フィルタ :
- 「フィルターを適用するときは、常に小文字に変換し、like演算子を使用してください。」
- 「フィルター値のステータスに略語を使用してください。」
-
質問に答える関数を指定し、戻り値の指示を提供します 。
- 「四半期には
adventureworks.oneb.get_quarter(date)
UDFを使用してください。get_quarter()
の出力は四半期で、1、2、3、または 4 のいずれかです。これを使用して、必要に応じてデータをフィルタリングします。
- 「四半期には
サンプルの SQL クエリと関数を追加する
「SQL クエリ」 タブを使用して、以下を追加します。
-
クエリの例(推奨): SQLクエリの例は、Genieがユーザーの質問に答えるための正しいSQLを生成するのに役立ちます。クエリは、静的またはパラメータ化できます。各 SQL クエリの例について、サンプルの質問と、予期される結果を返す一致する SQL を指定します。Genieは、この例を直接使用して問題を一致させたり、そこから学習して関連する質問に答えたりすることができます。パラメータ化されたクエリを使用して応答を生成すると、そのクエリは [信頼済み ] としてマークされます。スペースで CAN EDIT 権限を持つユーザーは、レスポンスの生成に使用されたクエリを表示できるため、トラブルシューティングや絞り込みに役立ちます。
-
SQL関数:: 静的またはパラメータ化されたSQLクエリで回答できない質問については、カスタム関数をUnity Catalogに登録することができます。機能はチーム間で共有でき、Genieが特定の質問に答えるために使用できます。SQL 関数を使用して回答された応答は、信頼できるものとしてマーク されます 。スペースでの 関数の使用について詳しくは、「SQL Genieでの信頼できるアセットの使用AI/BIGenie spaces 」を参照してください。
Genie がサンプル クエリを使用する方法
クエリの例は、Genie が利用可能なデータを使用して質問に答える方法を示しています。テキストフィールドにサンプルの質問を入力し、その質問に答えるSQLクエリを入力します。Genie は、一致する質問を受け取ると、サンプル クエリを直接使用して回答を提供できます。Genieが同様の質問を受けると、サンプルクエリの手がかりを使用して、応答で提供されるSQLを学習し、構造化します。次の例のように、組織とデータに固有のロジックを強調するサンプルの提供に重点を置きます。
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
パラメータ化されたクエリの例では、スペース ユーザーは、実行時にクエリに挿入する特定の値を指定できます。 パラメーター化されたクエリの操作の詳細については、「 SQL クエリでのパラメーターの使用」を参照してください。
GenieはSQL関数をどのように使用しますか?
SQL 関数は、静的クエリやパラメータ化されたクエリではキャプチャできない複雑なロジックが質問に含まれている場合に便利です。これらは Unity Catalog に格納され、ユーザーが指定したパラメーターを使用して Genie 呼び出すことができます。 Genie は、関数で使用される SQL を表示または変更できないため、このアプローチは、表示または変更すべきでないロジックに適しています。Unity Catalog に関数を登録する方法については、「 SQL テーブル関数を作成する 」および 「Unity Catalog でのユーザー定義関数 (UDF)」を参照してください。
Genieスペースをテストする
ほとんどのユーザーインタラクションはチャットウィンドウで行われます。 スペースが思い通りに機能しているかどうかを知る最善の方法は、ビジネスユーザーが尋ねると予想される現実的な質問でスペースをテストすることです。
設定に入力したサンプルの質問は、チャットウィンドウに表示されます。 これらのサンプル質問は、ユーザーが Genieスペースにどのような質問をできるかを理解するのに役立ちます。 ユーザーが質問を入力するテキストフィールドは、画面の下部近くにあります。
レスポンスはテキストフィールドの上に表示されます。ユーザーが質問を入力すると、その質問はチャット履歴に保存されます。
新しい会話を開始するには:
- [ 新しいチャット ] をクリックして、新しいチャットを開始します。[
] をクリックして、前の会話を開きます。
- 質問する... テキスト入力フィールドに質問を入力します。
回答を確認する
通常、回答は、質問に対する自然言語の回答と、関連する結果セットを示す表として提供されます。 Genie は、視覚化によって応答の明確さが向上する可能性があることを検出すると、視覚化も返します。 正確な回答構造は、質問によって異なります。 すべての応答には、質問に答えるために生成された SQL クエリが含まれます。 生成されたコードを表示 をクリックして、生成されたクエリを表示します。
Genieは、他の大規模言語モデル(LLM)と同様に、非決定論的な動作を示すことがあります。つまり、同じプロンプトを複数回送信すると、異なる出力が表示される場合があります。Genie が学習できる SQL クエリの例を提供することで、Genie の一貫性を高めることができます。「SQL クエリと関数の例の追加」を参照してください。
応答の右下には、オプションのアクションが含まれています。 ユーザーは、レスポンス CSV をクリップボードにコピーし、 CSV ファイルとしてダウンロードし、 Genieスペースの指示として追加し、回答に賛成票を投じたり、反対票を投じたりすることができます。 ビジュアライゼーションを編集するには、ビジュアライゼーションの右上隅にある編集アイコンをクリックします。 ビジュアライゼーションの編集方法に関するその他の説明については、「 ビジュアライゼーションの生成」を参照してください。
表形式のデータを含む回答の後に、 クイックアクション タイルのセットが表示されます。これらを使用して、ビジュアライゼーションを生成できます。
クエリ結果を取得した後に、視覚化を単語で記述して視覚化を生成することもできます。 ビジュアライゼーションの生成を参照してください。
結果の書式設定
レスポンス内のテーブルの列をフォーマットするには、列ヘッダーの ケバブメニューをクリックし、 フォーマット をクリックして使用可能なオプションを表示します。 書式設定オプションは、列のデータ型によって異なります。
結果セットのダウンロード
スペース利用者は、最大約1GBの結果データをCSVでダウンロードできます。 最終的なファイルのダウンロード サイズは、最終的なファイル ダウンロードよりも前のステップに 1 GB の制限が適用されるため、1 GB よりわずかに大きい場合と小さい場合があります。 結果をダウンロードするには、応答のダウンロードアイコンをクリックします。
ビジュアライゼーションの生成
ユーザーは、チャット ウィンドウを使用するか、応答に続く クイック アクション セクションに示されている推奨される視覚化のいずれかを使用して、視覚化を明示的に要求できます。 Genie は、応答の一部として視覚化を提供する場合があります。 自動的に生成されたビジュアライゼーションを非表示にするには、 折りたたみアイコンをクリックします。 再度表示するには、 ビジュアライゼーションを表示 をクリックします。
チャットウィンドウでビジュアライゼーションを編集できます。
次のグラフ タイプがサポートされています。
- エリア
- 棒
- 折れ線
- 円グラフ
- 散布図
ビジュアライゼーションを編集するには:
- ビジュアライゼーションの右上隅にある
編集アイコンをクリックします。 ページの右側に編集ウィンドウが開きます。
- ビジュアライゼーション ドロップダウン メニューを使用して、別のグラフ タイプを選択します。
- ほとんどのグラフ タイプでは、 X 軸 と Y 軸 のドロップダウン メニューを使用して、各軸に表示される値を選択します。 円 グラフの場合は、 角度 ドロップダウン メニューを使用して、表示する列を選択します。
- (オプション)配色をカスタマイズするには、 色 カテゴリの + をクリックします。
- (オプション)ビジュアライゼーションにカーソルを合わせたときにツールヒントに表示するデータを選択するには、 ツールヒント セクションの + をクリックします。
応答フィードバックの提供
各AI/BI Genieのレスポンスには、親指を立てる、または下げるフィードバック ボタンが含まれています。 Databricks では、このメカニズムを使用して、ユーザーにスペースに関するフィードバックを提供するよう促すことを推奨しています。
クエリ結果を含む応答の場合、ユーザーは をクリックして、Genie スペース エディターによるレビューを要求できます。生成された回答の品質や正確性について疑問がある場合は、レビュー用にマークし、必要に応じてコメントや質問を追加できます。
ビジネス ユーザーは、レビュー用にマークした質問の更新を [履歴 ] ページで確認できます。Genieスペースに対して少なくともCAN MANAGE権限を持つユーザーは、特定の交換を確認し、リクエストにコメントし、応答を確認または修正できます。モニタリングページでフィードバックにアクセスし、リクエストを確認できます。 その後、そのフィードバックを使用して、応答を調整し、スペースを反復できます。「スペースの監視」を参照してください。
スペースを監視する
Genieスペースは、1回限りのデプロイメントではなく、データチームとビジネスユーザーが知識を蓄積するための継続的なコラボレーションツールとなることを目的としています。ビジネスユーザーが答えを必要としている新しい質問を理解することは、知識の構築に不可欠です。 モニタリング タブを使用して、個々の質問と回答、ユーザーから提供された高評価または低評価のフィードバック、レビュー用にマークされた質問を表示します。
モニタリング タブには、スペースで尋ねられたすべての質問と回答が表示されます。 時間、評価、ユーザー、またはステータスで質問をフィルタリングできます。スペースをモニタリングすることで、 Genieスペースの編集者は、ビジネスユーザーから寄せられた問い合わせや、 Genieスペースがどのように応答したかを積極的に理解することができます。
Genieが苦手とする質問を特定することで、Genieスペースに対して具体的な指示を出し、回答を改善することができます。質問をクリックすると、質問と回答のテキストが開きます。このビューからチャットスレッド全体にアクセスすることもできます。
生成された SQL の編集
任意の応答で生成された SQL を確認して編集できます。 Genieスペースの作成者は通常、 Genieが誤った回答を生成しているかどうかを認識できる領域とデータを知っています。 多くの場合、生成された SQL クエリを少し手動で調整するだけでエラーを修正できます。 応答に対して生成された SQL を表示するには、 「生成されたコードを表示」 をクリックしてクエリを調べます。
Genie スペースに対する CAN EDIT以上の権限を持っている場合は、生成されたSQLステートメントを修正できます。修正を行ったら、クエリを実行します。 その後、将来Genieに答え方を教えるための指示として保存できます。 編集したクエリを保存するには、 指示として保存 をクリックします。
Genieスペースを共有する
Genieスペースのユーザーは、データにアクセスするために自分の資格情報を使用する必要があります。 アクセスできないデータに関する質問は、空の回答を生成します。
Genieスペースのユーザーは、 Genieスペースにアタッチされたウェアハウスに対するCAN USE権限と、スペースに表示される Unity Catalog オブジェクトに対するアクセス権限を持っている必要があります。 「どのデータを使用すべきか」を参照してください。
新しい Genieスペースは、デフォルトによってユーザーフォルダに保存されます。 他のワークスペース オブジェクトと同様に、これらのオブジェクトは、外側のフォルダーからアクセス許可を継承します。 ワークスペースのフォルダ構造を使用して、他のユーザーと共有できます。 ワークスペース オブジェクトをフォルダーに整理するを参照してください。
また、特定のアクセス許可レベル (CAN MANAGE、CAN EDIT、CAN RUN、CAN VIEW) で共有する特定のユーザーまたはグループを指定することもできます。
特定のユーザーまたはグループと共有するには:
- [共有] をクリックします。
- スペースを共有するユーザーまたはグループを入力します。 次に、 追加 をクリックして、適切なアクセス許可レベルを設定します。 個々のユーザーと小規模なグループのメンバーには、スペースが共有されたことを確認する Eメール 通知が届きます。
- [共有] ダイアログの下部にある リンクをコピー ボタンを使用して、 Genieスペースへの共有可能なリンクを取得します。 特権ユーザーは、リンクをクリックして新しいタブでGenieスペースを開き、質問することができます。
Genieスペースのクローン
Genieスペースをクローンすると、すべてのセットアップコンテキストと手順を含むコピーが作成されます。クローニングは、別のスペースで変更をテストしたり、元のコンテキストを新しいスペースで再利用したりする場合に便利です。スペースがクローンされると、新しいスペースは元のスペースから独立します。元のものに影響を与えずに編集や調整を行うことができます。
次のエレメントは、クローン作成された Genieスペースにコピーされます。
- テーブルと設定
- 一般的な指示
- SQL クエリの例
- SQL 関数
既存のチャット スレッドと 履歴 データは、新しいスペースにコピーされません。
Genieスペースをクローンするには、次の手順を実行します。
- クローンを作成するGenieスペースを開きます。
- スペースの右上隅にある Kabab メニュー ケバブ メニューをクリックします。
- クローンを作成 をクリックします。
- (オプション) クローン ダイアログで、クローン作成されたGenieスペースの新しい名前とワークスペース・フォルダの場所を指定します。
- クローン をクリックして、新しいスペースを作成します。
スペースの準備のベストプラクティス
ベスト プラクティスに関するガイダンスと問題のトラブルシューティングのヘルプについては、 効果的な Genieスペースのキュレーションを参照してください。
使用状況の監視
監査ログを使用して、Genieスペースの使用状況を監視できます。 AI/BI Genie イベントを参照してください。
Genie 会話 API を使用する
プレビュー
この機能は パブリック プレビュー段階です。
Genie会話APIは、既存のGenieスペースのエンドポイントを公開し、質問をしたり、生成されたSQLやクエリ結果を取得したり、Genieスペースに関連付けられた詳細を取得したりできます。Conversations APIのスループットレートはベストエフォート型で、システム容量によって異なります。通常またはトラフィックの少ない条件下では、要求はワークスペースあたり 1 分あたり 5 クエリに制限されます。ピーク使用期間中は、使用可能な容量に基づいて要求が処理されるため、実際のスループットが低下する可能性があります。
Mosaic AI Agent Framework を使用してマルチエージェント システムを作成する方法については、「 マルチエージェント システムでの Genie の使用」を参照してください。