Genieスペースとは何ですか?

プレビュー

この機能は パブリック プレビュー段階です。ワークスペース管理者は、プレビューページからこの機能を有効にできます。「Databricksプレビューの管理」を参照してください。

AI/BI Genieは、DatabricksIQ を搭載したコード不要のインターフェースで、ビジネスユーザーが自然言語を使用してセルフサービスのデータ分析を実行できるようにします。データアナリストなどのドメイン エキスパートは、データセット、サンプル クエリ、テキスト ガイドラインを使用してGenieスペースを構成し、genieがビジネス上の質問を分析クエリに変換できるようにします。設定後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして、運用データを理解できます。Genieは、データの変更やユーザーからの新たな質問に応じて、セマンティックナレッジを継続的に更新します。 「DatabricksIQを利用した機能」を参照してください。

データアナリストは、次の操作を実行して、ビジネス ユーザー向けにドメイン固有のGenieスペースエクスペリエンスを準備できます。

  • Unity Catalogから関連するテーブルを選択し、そのメタデータ (テーブルと列の説明) をGenieスペースに公開します。

  • 組織固有の情報 (ビジネス ロジックとメタデータ) をGenieスペースに転送する指示を追加します。

初期設定後、ユーザーは検証済みのSQL回答を指示として保存することで、時間の経過とともにGenieのデータとセマンティクスの理解を段階的に向上させることができます。「手順を指示を与える」を参照してください。

使用例

さまざまな非技術者層に対応するために、さまざまなGenieスペースを作成できます。次のシナリオでは、考えられる 2 つのユース ケースについて説明します。

営業案件の状態を可視化する

営業マネージャーは、営業パイプラインのステージごとに、オープンおよびクローズ済みの商談の現在のステータスを取得したいと考えています。自然言語を使用してGenieスペースと対話し、視覚化を自動的に生成できます。

次のgifはこのインタラクションを示しています。

質問、回答、自動生成されたビジュアライゼーションを含むGif

物流の追跡

物流会社は、さまざまな部門のビジネス ユーザーが業務および財務の詳細を追跡できるように、Genieスペースを使用したいと考えています。彼らは、出荷施設の管理者が出荷を追跡するためのGenieスペースと、財務担当役員が財務状況を把握するための Genieスペースを設置しました。

Genieスペースの回答はどのように生成されますか?

Genieスペースは、テーブル名と列名および説明を使用して、自然言語の質問に対する回答を生成します。テーブル内の実際のデータは、Genieからは非表示のままです。

Genieは、名前と説明を使用して、自然言語の質問を同等の SQL クエリに変換します。そして、そのクエリの結果をテーブルとして返します。Genieスペースの作成者とビジネス ユーザーは、各回答を生成する生成されたSQLクエリを検査できます。

技術要件

  • GenieスペースはUnity Catalogに登録されたデータを使用します。

  • Genieスペースには Pro またはサーバーレス SQL ウェアハウスが必要です。

必要な権限

Genieスペースを作成、編集、使用するには、次の権限が必要です。

注:

データとコンピュートへのアクセスを設定するには、通常は管理者に制限されている上位の権限が必要です。「SQLウェアハウスの作成」と「Unity Catalogでの特権の管理」を参照してください。

  • コンピュート権限:作成者、編集者、およびユーザーは、そのスペースに指定されたデフォルトのSQLウェアハウスへの使用可能(CAN USE)権限が必要です。作成者は、スペースを作成するときにデフォルトのSQLウェアハウスを選択します。作成者は、実行可能(CAN RUN)権限を持つ任意のSQLウェアハウスを選択できます。

  • データ アクセス権限:スペースを操作するすべてのユーザーは、スペースで使用されるデータに対して少なくともSELECT権限が必要です。

  • Genieスペースの権限:ユーザーがGenieやスペースで使用されるデータを操作するには、Genieスペースでの実行可能(CAN RUN)権限が必要です。Genieスペースの権限と能力の完全なマッピングについては、「 GenieスペースのACL」を参照してください。

どのデータを使うべきですか?

1つ以上のUnity Catalog管理テーブルに基づいて、新しいGenieスペースを作成できます。Genieは、Unity Catalog オブジェクトに添付されたメタデータを使用して回答を生成します。適切に注釈が付けられたデータセットと、提供する具体的な指示を組み合わせることが、エンドユーザーにとって好ましいエクスペリエンスを生み出す鍵となります。

Databricksでは、次のことを推奨しています。

  • 分析用にデータをキュレーションする:ビューをレイヤー化して列数を減らし、ユースケース固有の情報を追加して回答の質を高めます。

  • Genieスペースのテーブルと列の数を最小限に抑える:特定のドメインの質問に答えるのに必要なテーブルと列だけを取り込みます。不要な表や列があると、Genieが混乱したり、間違った回答をしたり、エラーメッセージを表示したりする原因になります。

新しいGenieスペースを作成する

以下のリストで説明されている新しいスペースダイアログ。

新しいGenieスペースを作成すると、 [新しいスペース]ダイアログに次のオプションが表示されます。

  • タイトル: タイトルは、他のワークスペース オブジェクトとともにワークスペース ブラウザーに表示されます。エンドユーザーがGenieスペースを見つけるのに役立つタイトルを選択します。

  • 説明: ユーザーは、 Genieスペースを開いたときに説明が表示されます。このテキスト領域を使用して、ルームの目的を説明します。

  • デフォルト ウェアハウス : このコンピュート リソースは、 スペースで生成されるSQL genieステートメントを強化します。エンドユーザーは、スペースを操作できるように、このウェアハウスへのアクセスが必要です。Genieスペースは、プロまたはサーバーレスのSQLウェアハウスを使用できます。サーバレスSQLウェアハウスは最適なパフォーマンスを提供します。

  • テーブル: Genieスペースは 1 つ以上のテーブルに基づくことができます。[テーブルを追加] ボタンをクリックすると新しいダイアログが開き、追加するUnity Catalogテーブルを選択できます。

  • 質問サンプル:質問サンプルは任意です。チャットに表示され、ユーザーが質問できるタイプの例を提供します。作成中に追加することも、後でスペースの設定から追加することもできます。

Genieスペースでチャットする

ほとんどのGenieスペースのやり取りはチャット ウィンドウで行われます。

以下の文章で説明されている、新しいチャットウィンドウ。

新しいチャット ウィンドウには、厳選されたサンプルの質問のセットが含まれています。これらのサンプルの質問は、ユーザーがGenieスペースでどのような質問をできるかを理解するのに役立ちます。ユーザーが質問を入力するテキストフィールドは、画面の下部近くにあります。

回答はテキストフィールドの上に表示されます。ユーザーが質問を入力すると、左ペインのチャット履歴スレッドに保存されます。

チャット履歴

チャット履歴のスレッドはユーザーごとに保存され、過去の質問や回答を参照することができます。ユーザーは、チャットスレッドから質問を再送信または修正することもできます。左ペインの新規チャットボタンをクリックすると、新しいスレッドが開始されます。

各チャットスレッドはそのコンテキストを維持するため、アシスタントは以前の質問を考慮します。これにより、ユーザーはフォローアップの質問をして、結果セットをさらに調査したり、焦点を絞ったりすることができます。

回答の構成

正確な回答の構成は、質問によって異なります。多くの場合、回答には自然言語による説明と、関連する結果セットを示す表が含まれています。すべての回答には、質問に答えるために生成されたSQLクエリが含まれます。[生成されたコードの表示] をクリックして、生成されたクエリを表示します。

回答の右下には、オプションのアクションが含まれています。回答のCSVクリップボードにコピーし、 CSVファイルとしてダウンロードして、 Genieスペースの指示として追加し、回答に賛成または反対の投票を行うことができます。

表形式のデータを含む回答の後に、クイックアクションタイルのセットが表示されます。これらを使用して、ビジュアライゼーションを生成できます。

さまざまな視覚化オプションを提案するクイック アクション タイル。

クエリ結果を取得した後、言葉で説明することでビジュアライゼーション を生成することもできます。

回答に対するフィードバックの提供

Genieの各回答には、「役に立つ」または「役に立たない」のフィードバックボタンがあります。Databricksでは、このメカニズムを使ってスペースに関するフィードバックをユーザーに提供してもらうことを推奨しています。フィードバックは、回答を調整し、スペースを反復するために使用することができ、モニタリングページからアクセスできます。「スペースを監視する」をご覧ください。

スペースを監視する

Genieスペースは、一度限りのデプロイメントではなく、データ チームとビジネス ユーザーが知識を蓄積するための継続的なコラボレーション ツールとして設計されています。ナレッジの構築には、ビジネ ユーザーが答えを必要としている新しい質問を理解することが不可欠です。モニタリング ページでは、スペースで作業しているユーザーから提供された個々の質問と回答、および「役に立つ」または「役に立たない」のフィードバックを表示できます。Genieスペースのサイドバーにある監視アイコン モニタリングをクリックして、モニタリング ページを開きます。

説明されている機能を示すモニタリングページの例。

[モニタリング] ページには、スペースで尋ねられたすべての質問と回答が表示されます。質問は、時間、評価、ユーザー、ステータスでフィルタリングできます。スペースをモニタリングすることで、Genieの作者はビジネス ユーザーから寄せられた質問やGenieスペースがどのように回答したかを積極的に理解することができます。

Genieが苦手とする質問を特定することで、Genieスペースに対して具体的な指示を出し、回答を改善することができます。質問をクリックすると、質問と回答のテキストが開きます。このビューからチャットスレッド全体にアクセスすることもできます。

指示を与える

指示は、Genieの回答をガイドして、特定のドメインで固有の専門用語、ロジック、および概念を処理できるようにするのに役立ちます。手順は、クエリの例やプレーンテキストのスニペットとして記述して、Genieがスペース ユーザーが尋ねる可能性のある質問に回答するのに役立てることができます。包括的な説明は、シームレスで直感的なGenieスペースのエクスペリエンスに不可欠です。

Genieスペースのサイドバーにある指示アイコン [指示] をクリックして、指示ペインを開きます。

指示パネル

次の例は、さまざまなタイプの指示を示しています。

  • 会社固有のビジネス情報:

    • 「私たちの会計年度は2月に始まります」

  • 値、エイリアス、または共通フィルタ

    • 「フィルターを適用するときは、常に小文字に変換し、like演算子を使用してください。」

    • 「フィルター値のステータスに略語を使用してください。」

  • Unity Catalogで使用できるユーザー定義関数:

    • 「四半期には、 adventureworks.oneb.get_quarter(date) UDF を使用してください。get_quarterのアウトプットは四半期であり、1、2、3、または4のいずれかです。これを使用して、必要に応じてデータをフィルタリングしてください。

      たとえば、第3四半期の場合は、 adventureworks.oneb.get_quarter(posted_date) = 3”`”を使用します。

  • SQL命令のサンプル:

    • アシスタントに生成させるクエリのサンプルを提供できます。

    • 次の例のように、ご自分の組織やデータに固有のロジックに焦点を当てたサンプルを提供することに重点を置いてください。

    -- Return our current total open pipeline by region.
    -- Opportunities are only considered pipelines if they are tagged as such.
    SELECT
      a.region__c AS `Region`,
      sum(o.amount) AS `Open Pipeline`
    FROM
      sales.crm.opportunity o
      JOIN sales.crm.accounts a ON o.accountid = a.id
    WHERE
      o.forecastcategory = 'Pipeline' AND
      o.stagename NOT ILIKE '%closed%'
    GROUP BY ALL;
    

Genieスペースの説明を 1 つの長いメモとして整理したり、関連するトピックごとにグループ化して構造を改善したりできます。

生成されたSQLを編集する

生成されたSQLは、どの回答でも確認して編集できます。Genieスペースの作者は通常、Genieが間違った答えを生成していることを認識できるようにドメインとデータに関する知識を持っています。多くの場合、生成されたSQLクエリ自体を少し手動で調整するだけでエラーを修正できます。任意の回答に対して生成されたSQLを表示するには、「生成されたコードを表示」をクリックしてクエリを調べてください。

Genieスペースで少なくとも編集可能(CAN EDIT)権限を持っているユーザーは、生成されたSQLステートメントを編集して修正できます。編集後、クエリを実行します。その後、それを指示として保存し、将来Genieに回答方法を教えることができます。編集したクエリを保存するには、指示として保存アイコン[指示として保存] をクリックします。

ルームの準備に関するベストプラクティス

  • ルームユーザーに答えてもらいたい、明確な質問をいくつか含めてください。

  • 回答の品質を確認するには、Genieスペースをテストします。モデルが期待どおりの回答を提供するかどうかを確認するには、次のことを試してください。

    • 提供した質問を言い換えてください。

    • データセットに関連するその他の質問をしてください。

  • 質問に対して期待通りの回答が得られるまで、 Genieスペースの指示を追加および調整します。

Genieスペースを共有する

重要

Genieスペースユーザーは、独自の資格情報を使用してデータを操作する必要があります。アクセスできないデータに関する質問では、空の回答が生成されます。

Genieスペースのユーザーには、 Genieスペースにアタッチされたウェアハウスに対する使用可能(CAN USE)権限と、スペースに表示されるUnity Catalogオブジェクトに対するアクセス権限が必要です。「使用するデータ」を参照してください。

新しいGenieスペースは、デフォルトでユーザーフォルダに保存されます。他のワークスペース オブジェクトと同様に、それらは囲むフォルダーから権限を継承します。ワークスペース フォルダー構造を使用して、他のユーザーと共有できます。「ワークスペース オブジェクトをフォルダーに整理する」を参照してください。

また、特定の権限レベル(管理可能編集可能実行可能表示可能)で共有する特定のユーザーまたはグループを指定することもできます。

特定のユーザーまたはグループと共有するには:

  1. [共有] をクリックします。

  2. 「共有」ダイアログで、「ワークスペースで開く」をクリックします。

  3. ワークスペースのブラウザウィンドウで、共有したいユーザーまたはグループを入力し、適切な権限レベルを設定します。