AI/BI Genieスペースの設定と管理
この記事では、ビジネスユーザーがデータについて自然言語で質問するためのチャットインターフェースであるGenieスペースを設定および管理する方法について説明します。
技術要件と制限
Genieスペースの使用には、次の要件と制限が適用されます。
- Unity Catalog: Genieスペースのデータは、 Unity Catalogに登録する必要があります。
- コンピュート: プロまたはサーバレス SQLウェアハウスを使用する必要があります。
- スループット: 各ワークスペースは、すべての Genieスペースで1分あたり最大20の質問を処理できます。
- 能力: 各 Genieスペースは最大 10,000 件の会話をサポートでき、各会話には最大 10,000 件のメッセージを含めることができます。
必要な権限
Genieスペースを作成、編集、および使用するには、次の権限が必要です。
- コンピュートの権限: Genieスペースの作成者、編集者、およびユーザーには、スペースに指定されたデフォルト SQLウェアハウスへの CAN USE アクセス権が必要です。 作成者は、スペースを作成するときに Default SQLウェアハウスを選択します。 CAN RUN権限を持つ任意のSQL ウェアハウスを選択できます。
- データ アクセス権限: スペースを操作するすべてのユーザーは、スペースで使用されるデータに対して少なくとも
SELECT
権限が必要です。 - Genieスペースの権限: Genieユーザーがスペースで使用されるGenie やデータを操作するには、 スペースに対するCAN RUN 権限が必要です。Genieスペースの権限と機能の完全なマッピングについては、Genieスペース ACLを参照してください。
データとコンピュート アクセスを構成するには、通常は管理者に限定された昇格されたアクセス許可が必要です。 SQLウェアハウスの作成およびUnity Catalogでの権限の管理を参照してください。
Genie アクセスの管理
Genieは、アカウントレベルで有効にする必要があるパートナー主導の支援機能を使用します。 アカウントでこれらの機能を管理する方法については、「 Databricks Assistant を有効にして試す」を参照してください。
この機能へのアクセスを管理するには、アカウント管理者である必要があります。 パートナーを利用した機能を無効にしても、 SQL エンタイトルメントを持つユーザーはサイドバーの Genie アイコンをクリックできますが、 Genieスペースにはアクセスできません。
新しいGenieスペースを作成する
Genieスペースによってデータアナリストは、次の手順を実行して、ビジネスユーザー向けのドメイン固有の Genieスペースエクスペリエンスを作成できます。
-
サイドバーの Genie をクリックします。
-
画面の右上隅にある 新規 をクリックします。
-
新規 ダイアログで、初期設定を選択します。オプションについては、次のように説明します。
- タイトル : タイトルは、他のワークスペース オブジェクトとともにワークスペース ブラウザーに表示されます。エンドユーザーがGenieスペースを見つけるのに役立つタイトルを選択します。
- 説明 : ユーザーが Genieスペースを開くと、説明が表示されます。 このテキスト領域を使用して、スペースの目的を説明します。 説明フィールドは Markdown の書式設定をサポートしているため、テキストのスタイルを設定し、役立つコンテキストや参照へのリンクを提供できます。 マークダウン構文の詳細については、 このガイドを参照してください。
- デフォルト ウェアハウス: このコンピュート リソース は、SQL で生成されるGenieスペースステートメントを強化します。エンドユーザーは、スペースを操作するためにこのウェアハウスにアクセスする必要があります。 Genieスペースでは、プロまたはサーバレス ウェアハウスSQL使用できます。最適なパフォーマンスを得るために、 Databricks はサーバレス SQLウェアハウスを使用することをお勧めします。
- テーブル : 1 つ以上のテーブルからGenieスペースを作成できます。 最大で 25 個のテーブルを含めることができます。 テーブルの追加 ボタンをクリックすると、新しいダイアログが開き、含める Unity Catalog テーブルを選択できます。
- 質問サンプル :質問サンプルは任意です。チャットに表示され、ユーザーが質問できるタイプの例を提供します。作成中に追加することも、後でスペースの 設定 から追加することもできます。
指示を提供する
命令は、Genieが特定のドメイン内の固有の専門用語、ロジック、および概念を処理できるように、Genieの応答をガイドするのに役立ちます。 包括的な指示は、シームレスで直感的な Genieスペースエクスペリエンスに不可欠です。 指示を入力するには、 Genieスペースのサイドバーで「 指示 」をクリックして、指示ペインを開きます。このペインを使用して、 一般的な命令 、 SQL クエリの例 、 および SQL 関数 を追加します。
Genieスペースには、合計で最大100の指示を追加できます。 次のものがカウントに寄与します。
- 一般的な命令 のテキストのブロック全体が 1 つとしてカウントされます。
- 各 SQL クエリの例は 1 つとしてカウントされます。
- 各 SQL 関数は 1 つとしてカウントされます。
一般的な指示
Genieが従うべきビジネスまたは応答の好みを伝えるプレーンテキストの指示を提供します。 指示を 1 つの包括的なメモとして書式設定したり、トピックごとに分類して整理しやすくしたりできます。
以下は、一般的な手順に含めることができる情報の例を示しています。
-
会社固有のビジネス情報 :
- 「私たちの会計年度は2月に始まります」
-
値、エイリアス、または共通フィルタ :
- 「フィルターを適用するときは、常に小文字に変換し、like演算子を使用してください。」
- 「フィルター値のステータスに略語を使用してください。」
-
質問に答える関数を指定し、戻り値の指示を提供します 。
- 「四半期には
adventureworks.oneb.get_quarter(date)
UDFを使用してください。get_quarter()
の出力は四半期で、1、2、3、または 4 のいずれかです。これを使用して、必要に応じてデータをフィルタリングします。
- 「四半期には
SQL クエリの例
SQL クエリの例は、Genie のトレーニングを支援するために準備する SQL クエリです。 Genieは、関連するクエリをインテリジェントに選択して、質問に答えるときに応答を生成するのに役立ちます。 サンプルクエリを追加すると、データを使用して質問に答える方法をGenieに示すことができます。 また、サンプルの質問を追加して、サンプルクエリが回答すると予想される質問の種類についてGenieに教えることもできます。 Genieは、一致する質問を受け取った場合、サンプルクエリを直接使用して回答を提供できます。 同様の質問が返された場合は、サンプルクエリの手がかりを使用して、応答で提供されるSQLを構造化できます。 次の例のように、組織とデータに固有のロジックを強調するサンプルの提供に重点を置きます。
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
SQL クエリにパラメーターを追加する
パラメーターを使用すると、実行時に置き換えられる特定の値のプレースホルダーを使用してクエリの例を記述できます。 パラメーターを使用すると、 Genie ユーザーの質問から特定の入力を受け取り、サンプル クエリの構造を再利用して、検証済みの回答を信頼できる資産として提供できます。 たとえば、前の SQL クエリを調整して、 o.forecastcategory
値でフィルター処理するパラメーターを含めると、クエリでさまざまな予測カテゴリにタグ付けされた営業案件に関する質問に対処できます。 パラメーター化されたクエリを使用して、信頼できる資産としてラベル付けされた応答を生成する方法の詳細については、「AI/BI Genie スペースで信頼できる資産を使用する」を参照してください。
次のコード スニペットは、 o.forecastcategory
値のパラメーターを追加して変更した前の例を示しています。 パラメーター は、名前付きパラメーター マーカーと同じ構文を使用します。 名前付きパラメーター マーカーを参照してください。
-- Return our current pipeline at a stage by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = :forecast_category AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
クエリにパラメーターを追加するには:
-
クエリ内のパラメーターを配置する場所にカーソルを置きます。
-
パラメーターを追加 をクリックし、新しいパラメーターを追加します。
これにより、デフォルト名が
parameter
の新しいパラメーターが作成されます。 デフォルト名を変更するには、クエリエディタで名前を置き換えます。 エディターにコロンの後にパラメーター名 (:parameter_name
) を入力して、パラメーターを追加することもできます。
クエリ パラメーターの編集
パラメーターを編集するには、次の手順を実行します。
-
パラメーター名の横にある
をクリックします。 パラメーターの詳細 ダイアログが表示され、次の構成オプションが表示されます。
-
キーワード : クエリ内のパラメーターを表すキーワード。 キーワードは、クエリ内のテキストを直接更新することによってのみ変更できます。
-
表示名 : Genie がチャット エクスペリエンスで使用する人間が読める名前。 Genie がパラメーター化されたクエリを使用して応答を生成すると、表示名と関連する値が応答に含まれます。
-
型 : サポートされている型には、 文字列 、 日付 、 日付と時刻 、 数値 があります。
-
デフォルト型は 文字列 です。
-
数値 データ型では、 10 進数 と 整数 のどちらかを指定できます。デフォルトの数値型は 10 進数 です。
-
-
実際の入力値が選択したパラメーターの種類と一致しない場合、 Genie は入力値を誤った種類として扱い、結果が不正確になる可能性があります。
- UI の別の部分をクリックして、ダイアログを閉じます。
SQL 関数
SQL 関数は、Unity Catalog に保存され、Genie が特定の質問に答えるために使用するカスタム関数です。 Genie は、これらの関数を呼び出して、ユーザー指定のパラメーターを挿入できますが、基になる SQL コンテンツにはアクセスできません。 つまり、SQL関数は、Genieがアクセスまたは編集できないはずの複雑な引数や計算を含む一般的な特定の質問に答えるのに理想的です。 Unity Catalog に関数を登録する方法については、「 SQL テーブル関数を作成する 」および 「Unity Catalog でのユーザー定義関数 (UDF)」を参照してください。
Genieスペースをテストする
ほとんどのユーザーインタラクションはチャットウィンドウで行われます。 スペースが思い通りに機能しているかどうかを知る最善の方法は、ビジネスユーザーが尋ねると予想される現実的な質問でスペースをテストすることです。
設定に入力したサンプルの質問は、チャットウィンドウに表示されます。 これらのサンプル質問は、ユーザーが Genieスペースにどのような質問をできるかを理解するのに役立ちます。 ユーザーが質問を入力するテキストフィールドは、画面の下部近くにあります。
回答はテキストフィールドの上に表示されます。ユーザーが質問を入力すると、左ペインのチャット履歴スレッドに保存されます。
新しいチャットを開始するには:
チャットアイコンをクリックして、チャットウィンドウを開きます。
- 質問する... テキスト入力フィールドに質問を入力します。新しい会話スレッドを開始するには、 + 新しいチャット をクリックします。
回答を確認する
通常、回答は、質問に対する自然言語の回答と、関連する結果セットを示す表として提供されます。 Genie は、視覚化によって応答の明確さが向上する可能性があることを検出すると、視覚化も返します。 正確な回答構造は、質問によって異なります。 すべての応答には、質問に答えるために生成された SQL クエリが含まれます。 生成されたコードを表示 をクリックして、生成されたクエリを表示します。
Genieは、他の大規模言語モデル(LLM)と同様に、非決定論的な動作を示すことがあります。 つまり、同じプロンプトを複数回送信すると、異なる出力が表示される場合があります。 Genie が学習できる SQL クエリの例を提供することで、Genie の一貫性を高めることができます。 SQL クエリの例を参照してください。
応答の右下には、オプションのアクションが含まれています。 ユーザーは、レスポンス CSV をクリップボードにコピーし、 CSV ファイルとしてダウンロードし、 Genieスペースの指示として追加し、回答に賛成票を投じたり、反対票を投じたりすることができます。 ビジュアライゼーションを編集するには、ビジュアライゼーションの右上隅にある編集アイコンをクリックします。 ビジュアライゼーションの編集方法に関するその他の説明については、「 ビジュアライゼーションの生成」を参照してください。
表形式のデータを含む回答の後に、 クイックアクション タイルのセットが表示されます。これらを使用して、ビジュアライゼーションを生成できます。
クエリ結果を取得した後に、視覚化を単語で記述して視覚化を生成することもできます。 ビジュアライゼーションの生成を参照してください。
結果の書式設定
レスポンス内のテーブルの列をフォーマットするには、列ヘッダーの ケバブメニューをクリックし、 フォーマット をクリックして使用可能なオプションを表示します。 書式設定オプションは、列のデータ型によって異なります。
結果セットのダウンロード
スペース利用者は、最大約1GBの結果データをCSVでダウンロードできます。 最終的なファイルのダウンロード サイズは、最終的なファイル ダウンロードよりも前のステップに 1 GB の制限が適用されるため、1 GB よりわずかに大きい場合と小さい場合があります。 結果をダウンロードするには、応答のダウンロードアイコンをクリックします。
ビジュアライゼーションの生成
ユーザーは、チャット ウィンドウを使用するか、応答に続く クイック アクション セクションに示されている推奨される視覚化のいずれかを使用して、視覚化を明示的に要求できます。 Genie は、応答の一部として視覚化を提供する場合があります。 自動的に生成されたビジュアライゼーションを非表示にするには、 折りたたみアイコンをクリックします。 再度表示するには、 ビジュアライゼーションを表示 をクリックします。
チャットウィンドウでビジュアライゼーションを編集できます。
次のグラフ タイプがサポートされています。
- エリア
- 棒
- 折れ線
- 円グラフ
- 散布図
ビジュアライゼーションを編集するには:
- ビジュアライゼーションの右上隅にある
編集アイコンをクリックします。 ページの右側に編集ウィンドウが開きます。
- ビジュアライゼーション ドロップダウン メニューを使用して、別のグラフ タイプを選択します。
- ほとんどのグラフ タイプでは、 X 軸 と Y 軸 のドロップダウン メニューを使用して、各軸に表示される値を選択します。 円 グラフの場合は、 角度 ドロップダウン メニューを使用して、表示する列を選択します。
- (オプション)配色をカスタマイズするには、 色 カテゴリの + をクリックします。
- (オプション)ビジュアライゼーションにカーソルを合わせたときにツールヒントに表示するデータを選択するには、 ツールヒント セクションの + をクリックします。
応答フィードバックの提供
各AI/BI Genieのレスポンスには、親指を立てる、または下げるフィードバック ボタンが含まれています。 Databricks では、このメカニズムを使用して、ユーザーにスペースに関するフィードバックを提供するよう促すことを推奨しています。
クエリ結果を含む応答の場合、ユーザーは をクリックして、Genie スペース エディターによるレビューを要求できます。生成された回答の品質や正確性について疑問がある場合は、レビュー用にマークし、必要に応じてコメントや質問を追加できます。
ビジネス ユーザーは、レビュー用にマークした質問の更新を 履歴 ページで確認できます。Genieスペースに対して少なくともCAN MANAGE権限を持つユーザーは、特定の交換を確認し、リクエストにコメントし、応答を確認または修正できます。 モニタリングページでフィードバックにアクセスし、リクエストを確認できます。 その後、そのフィードバックを使用して、応答を調整し、スペースを反復できます。 レビュー履歴とフィードバックを参照してください。
レビュー履歴とフィードバック
Genieスペースは、1回限りのデプロイメントではなく、データチームとビジネスユーザーが知識を蓄積するための継続的なコラボレーションツールとなることを目的としています。 ビジネスユーザーが答えを必要としている新しい質問を理解することは、知識の構築に不可欠です。 履歴ページでは、個々の質問と回答、ユーザーから提供された「サムズアップ」または「サムズダウン」のフィードバック、レビュー対象としてマークされた質問を表示できます。 履歴ページを開くには、Genieスペースのサイドバーで「 履歴 」をクリックします。
履歴ページには、スペースで尋ねられたすべての質問と回答が表示されます。 時間、評価、ユーザー、またはステータスで質問をフィルタリングできます。 スペースをモニタリングすることで、 Genieスペースの編集者は、ビジネスユーザーから寄せられた問い合わせや、 Genieスペースがどのように応答したかを積極的に理解することができます。
Genieが苦手とする質問を特定することで、Genieスペースに対して具体的な指示を出し、回答を改善することができます。質問をクリックすると、質問と回答のテキストが開きます。このビューからチャットスレッド全体にアクセスすることもできます。
生成された SQL の編集
任意の応答で生成された SQL を確認して編集できます。 Genieスペースの作成者は通常、 Genieが誤った回答を生成しているかどうかを認識できる領域とデータを知っています。 多くの場合、生成された SQL クエリを少し手動で調整するだけでエラーを修正できます。 応答に対して生成された SQL を表示するには、 「生成されたコードを表示」 をクリックしてクエリを調べます。
Genie スペースに対する CAN EDIT以上の権限を持っている場合は、生成されたSQLステートメントを修正できます。修正を行ったら、クエリを実行します。 その後、将来Genieに答え方を教えるための指示として保存できます。 編集したクエリを保存するには、 指示として保存 をクリックします。
Genieスペースを共有する
Genieスペースのユーザーは、データにアクセスするために自分の資格情報を使用する必要があります。 アクセスできないデータに関する質問は、空の回答を生成します。
Genieスペースのユーザーは、 Genieスペースにアタッチされたウェアハウスに対するCAN USE権限と、スペースに表示される Unity Catalog オブジェクトに対するアクセス権限を持っている必要があります。 「どのデータを使用すべきか」を参照してください。
新しい Genieスペースは、デフォルトによってユーザーフォルダに保存されます。 他のワークスペース オブジェクトと同様に、これらのオブジェクトは、外側のフォルダーからアクセス許可を継承します。 ワークスペースのフォルダ構造を使用して、他のユーザーと共有できます。 ワークスペース オブジェクトをフォルダーに整理するを参照してください。
また、特定のアクセス許可レベル (CAN MANAGE、CAN EDIT、CAN RUN、CAN VIEW) で共有する特定のユーザーまたはグループを指定することもできます。
特定のユーザーまたはグループと共有するには:
- [共有] をクリックします。
- スペースを共有するユーザーまたはグループを入力します。 次に、 追加 をクリックして、適切なアクセス許可レベルを設定します。 個々のユーザーと小規模なグループのメンバーには、スペースが共有されたことを確認する Eメール 通知が届きます。
- [共有] ダイアログの下部にある リンクをコピー ボタンを使用して、 Genieスペースへの共有可能なリンクを取得します。 特権ユーザーは、リンクをクリックして新しいタブでGenieスペースを開き、質問することができます。
Genieスペースのクローン
Genieスペースをクローンすると、すべてのセットアップコンテキストと手順を含むコピーが作成されます。これは、十分に開発されたスペースがあり、追加のテストのために新しいスペースを作成したり、元のスペースのコンテキストを再利用したりする場合に便利です。 スペースをクローンすると、新しいスペースは元のスペースから独立しているため、元のスペースに影響を与えずに編集や調整を行うことができます。
次のエレメントは、クローン作成された Genieスペースにコピーされます。
- テーブルと設定
- 一般的な指示
- SQL クエリの例
- SQL 関数
既存のチャット スレッドと 履歴 データは、新しいスペースにコピーされません。
Genieスペースをクローンするには、次の手順を実行します。
- クローンを作成するGenieスペースを開きます。
- スペースの右上隅にある Kabab メニュー ケバブ メニューをクリックします。
- クローンを作成 をクリックします。
- (オプション) クローン ダイアログで、クローン作成されたGenieスペースの新しい名前とワークスペース・フォルダの場所を指定します。
- クローン をクリックして、新しいスペースを作成します。
スペースの準備のベストプラクティス
ベスト プラクティスに関するガイダンスと問題のトラブルシューティングのヘルプについては、 効果的な Genieスペースのキュレーションを参照してください。
使用状況の監視
監査ログを使用して、Genieスペースの使用状況を監視できます。 AI/BI Genie イベントを参照してください。
Genie 会話 API を使用する
プレビュー
この機能は パブリック プレビュー段階です。
Genie会話APIは、既存のGenieスペースのエンドポイントを公開し、質問をしたり、生成されたSQLやクエリ結果を取得したり、Genieスペースに関連付けられた詳細を取得したりできます。Conversations APIのスループットレートはベストエフォート型で、システム容量によって異なります。通常またはトラフィックの少ない条件下では、要求はワークスペースあたり 1 分あたり 5 クエリに制限されます。使用量がピークに達すると、使用可能な容量に基づいて要求が処理されるため、実際のスループットが低下する可能性があります。