Agent Bricks: Multi-Agent Supervisor を使用して、調整されたマルチエージェント システムを作成する
ベータ版
この機能は ベータ版です。
このページでは、Agent Bricks: Multi-Agent Supervisor を使用して、AI エージェントとツールを連携して複雑なタスクに取り組むマルチエージェント スーパーバイザー システムを作成する方法について説明します。対象分野の専門家からの自然言語フィードバックに基づいて、彼らの調整を改善することができます。
Agent Bricks は、一般的なAIユースケース向けに、ドメイン固有の高品質のAIエージェントシステムを構築および最適化するためのシンプルなアプローチを提供します。
Agent Bricks: Multi-Agent Supervisor とは?
Agent Bricks: Multi-Agent Supervisorを使用して、Genie Spaces、エージェントエンドポイント、ツールを調整し、異なる専門ドメイン間で複雑なタスクを完了するためのスーパーバイザーシステムを作成します。Multi-Agent Supervisor は、高度な AI オーケストレーション パターンを使用して、エージェントのインタラクション、タスクの委任、結果の統合を管理し、包括的なソリューションを提供します。
Agent Bricks: Multi-Agent Supervisor がシステムを構築し、人間のフィードバックにより時間をかけて改善します。これは、次のユースケースをサポートするのに最適です。
- 調査レポートと利用データを検索することにより、市場分析と知見を提供します。
- 内部プロセスに関する質問に答え、そのチケットバックログを自動化します。
- ポリシー、FAQ、アカウント、その他の質問に答えることで、顧客サービスをスピードアップします。
Multi-Agent Supervisor を使用すると、スーパーバイザの調整品質を向上させ、対象分野の専門家からの自然言語フィードバックに基づいてエージェントの動作を調整できます。ラベリングセッションのタスクシナリオを提供し、それを専門家に送信してレビューアプリでレビューしてもらいます。その応答は、システムのパフォーマンスを最適化するのに役立つラベル付きデータを提供します。
Multi-Agent Supervisor は、アプリケーションのダウンストリームで使用できる包括的なエンドポイントを作成します。たとえば、Playground でプロンプトを送信してエンドポイントを操作したり、Databricks アプリを使用してチャット アプリケーションを構築したりできます。スーパーバイザには組み込みアクセス制御があるため、エンド ユーザーはアクセス権を持つサブエージェントとデータにのみアクセスできます。
必要条件
-
次のものを含むワークスペース。
- Mosaic AI Agent Bricks Preview (Beta) が有効になりました。Databricks プレビューの管理を参照してください。
- 本番運用 モニタリング for MLflow (Beta) が有効になっています。 これは、トレースが機能するために必要です。「 Databricks プレビューの管理」を参照してください。
- エージェントフレームワーク:ユーザー代理認証が有効になっています。「 Databricks プレビューの管理」を参照してください。ユーザー代理認証により、エージェントはエンドユーザーに代わって行動し、ユーザーのアクセス許可を尊重できます。「 ユーザー代理認証」を参照してください。
- サーバレス コンピュートが有効になりました。 サーバレス コンピュートの要件を参照してください。
- Unity Catalog が有効になっている。「Unity Catalog のワークスペースを有効にする」を参照してください。
- パートナーが提供する AI 支援機能が 有効になっています。
- サポートされているリージョン (
us-east-1
またはus-west-2
のいずれかのリージョンのワークスペース。 - Mosaic AI Model Servingへのアクセス。
system.ai
スキーマを使用した Unity Catalog の基盤モデルへのアクセス。- 非ゼロの 予算を持つサーバレス 予算ポリシー へのアクセス。
-
エージェントまたはツールをすぐに使用できる状態にしておく必要があります。次のいずれかを選択できます。
- 既存の Agent Bricks: Knowledge Assistant(/生成AI/agent-bricks/knowledge-assistant.md) エージェントエンドポイント。
- 既存の Genieスペース。Genieスペースを設定するには、「AI/BI Genieスペースの設定と管理」を参照してください。
-
スーパーバイザー エージェントのエンド ユーザーは、各サブエージェントと対話するための明示的なアクセス権が必要です。
- エージェントエンドポイントの場合、エンドユーザーには
CAN QUERY
権限が必要です。 - Genieスペースの場合、エンドユーザーはGenieスペースへのアクセスと、その基になるUnity Catalogオブジェクトへのデータアクセスの両方が必要です。「Genieスペースの共有」を参照してください。
- エージェントエンドポイントの場合、エンドユーザーには
マルチエージェントスーパーバイザーシステムの作成
ワークスペースの左側のナビゲーション ウィンドウで エージェント に移動し、 マルチエージェント スーパーバイザ ー をクリックします。
ステップ 1: サブエージェントを作成し、権限を付与する
Agent Bricks: Multi-Agent Supervisorは、サブエージェントを調整して複雑なタスクを完了するスーパーバイザーシステムを作成するため、最初にサブエージェントを調整するためのサブエージェントを提供する必要があります。これらのサブエージェントは、Genie Spaces または Knowledge Assistant エージェント エンドポイントにすることができます。また、スーパーバイザーがそのサブエージェントから有用な応答を返すように、エンドユーザーに各サブエージェントへの明示的なアクセス権を付与する必要があります。
- Genie space
- Agent endpoint
- Genieスペースを作成するには、「AI/BI Genieスペースの設定と管理」の手順に従ってください。
- エンドユーザーに、 Genieスペースとその基礎となる Unity Catalog オブジェクトの両方へのアクセス権を付与します。 Genieスペースを共有する手順に従います。
- ナレッジアシスタントエージェントを作成するには、「 エージェントブリックの使用:ナレッジアシスタント」の手順に従って、ドキュメントに対して高品質のチャットボットを作成します。
- エンドユーザーに、Knowledge Assistant エージェントエンドポイントに対する
CAN QUERY
権限を付与します。
ステップ 2: スーパーバイザーを設定する
[設定 ] タブで、スーパーバイザを設定し、調整するエージェントを追加します。
スーパーバイザには組み込みアクセス制御があるため、エンド ユーザーはアクセス権を持つサブエージェントとデータにのみアクセスできます。 エージェントエンドポイントの場合、エンドユーザーはエンドポイントに対する CAN QUERY
権限が必要です。Genie spacesの場合、エンド ユーザーは、Genieスペースへのアクセスと、基になるUnity Catalog オブジェクトへのデータ アクセスの両方にアクセスする必要があります。「Genieスペースの共有」を参照してください。エンド ユーザーがサブエージェントにアクセスできない場合、スーパーバイザは会話を終了します。エンド ユーザーがすべてのサブエージェントではなく一部のサブエージェントにアクセスできる場合、スーパーバイザは、ユーザーがアクセスできないサブエージェントから会話をリダイレクトします。
-
[名前 ] フィールドに、スーパーバイザ エージェントの名前を入力します。
-
「説明 」フィールドに、スーパーバイザー・システムで何ができるかを説明します。
-
[Configure Agents] で、最大 10 個のエージェントエンドポイントや Genie spacesを選択します。
- Genie Space
- Agent Endpoint
Genieスペースを提供するには:
-
[タイプ ] フィールドで、[ Genie Space ] を選択します。
-
Genieスペース ドロップダウンメニューからGenieスペースを選択します。
-
「エージェント名 」フィールドと 「コンテンツの説明 」フィールドは、可能な場合は自動的に入力されます。必要に応じて、名前と説明を編集できます。
スーパーバイザーは、説明の情報を使用してエージェントを調整します。タスクの委任を改善するために、できるだけ多くの詳細を提供します。
Genie spacesの詳細については、「AI/BI Genieスペースとは」を参照してください。Genieスペースを設定するには、「AI/BI Genieスペースの設定と管理」を参照してください。
エージェントエンドポイントを指定するには:
- 「タイプ 」フィールドで、「 エージェントエンドポイント 」を選択します。
- [Agent Endpoint ] ドロップダウンメニューからエンドポイントを選択します。Agent Bricks: Knowledge Assistant で作成されたエージェントエンドポイントのみがサポートされています。
- [エージェント名 ] フィールドは自動的に入力されます。これは必要に応じて編集できます。
- [コンテンツの説明] で、スーパーバイザーがこのエージェントにタスクを委任するタイミングを理解できるようにするために、このエージェントができることを説明します。
-
(オプション)エージェントをさらに追加するには、[ +追加 ]をクリックします。最大 10 人のエージェントを提供できます。
-
(オプション)[ Instructions ] フィールドで、マルチエージェント スーパーバイザーの応答方法に関するガイドラインを指定します。
-
エージェントの作成 をクリックします。
[構成 ] タブにリダイレクトされます。マルチエージェントシステムとスーパーバイザーエージェントを作成するには、数分から数時間かかる場合があります。
ステップ 3: スーパーバイザー エージェントをテストする
スーパーバイザーがビルドが完了したら、 AI Playground で試用してテストできます。スーパーバイザーは、複雑なタスクを処理するために複数のエージェントを調整します。右側のパネルにある 「エージェントのテスト 」では、エージェントとチャットして応答を評価できます。
- (オプション)AI Playground でエージェントをテストすることもできます。 「プレイグラウンドで開く」 をクリックします。これにより、スーパーバイザーのエンドポイントが接続された状態で AI Playground が開きます。AI支援機能を有効にしている場合は、 AI Judge と Synthetic タスクの生成 を有効にして、スーパーバイザーの評価に役立てることができます。
- [ Test your Agent ] または [AI Playground] で、スーパーバイザーの複雑なタスクを入力します。
- その応答を評価します。スーパーバイザーが適切なエージェントにタスクを正常に委任していることを確認します。
- エージェントの応答に基づいて、左側のパネルにある 説明 と 指示 のファイルを調整し、設定を改善します。
- エージェントの更新 をクリックします。
スーパーバイザーのパフォーマンスに満足している場合は、スーパーバイザーをそのまま使用し続けます。デフォルトでは、Agent Bricks エンドポイントは 3 日間非アクティブになるとゼロにスケーリングされるため、稼働時間に対してのみ請求されます。
ステップ 4: スーパーバイザーを改善する
エージェントブリック:マルチエージェントスーパーバイザーは、自然言語のフィードバックに基づいてスーパーバイザーの動作を調整できます。ラベリングセッションを通じて人間のフィードバックを収集し、スーパーバイザーの調整品質を向上させます。スーパーバイザーのラベル付きデータを収集すると、スーパーバイザーのパフォーマンスを向上させることができます。Agent Bricks は、新しいデータからスーパーバイザーを再トレーニングし、最適化します。
[改善 ] タブで、タスク シナリオを追加し、ラベル付けセッションを開始します。
-
ラベリングセッションに含めるタスクシナリオを追加します。
- [+ 追加 ] をクリックして、タスク シナリオを追加します。
- 「質問の追加 」モーダルで、エージェントの質問またはタスクを入力します。
- 「追加 」をクリックします。タスクがUIに表示されます。
- 評価するすべての質問を追加するまで繰り返します。
- 質問を削除するには、ケバブメニューをクリックし、[ 削除 ]をクリックします。
Databricks では、ラベル付けセッションに少なくとも 20 個の質問を追加して、十分なラベル付きデータが収集されるようにすることをお勧めします。
-
タスク シナリオの追加が完了したら、シナリオを専門家に送信してレビューしてもらい、高品質のラベル付きデータセットの構築に役立ててください。右側にある「 ラベル付けセッションの開始 」をクリックします。
ラベリングセッションの準備ができると、UIは次のように更新されます。
-
レビュー アプリを専門家と共有してフィードバックを収集します。 「SME 許可の付与 」をクリックし、ラベル付けセッションにアクセスするための適切な許可を付与する専門家を追加します。
ラベル付けセッションとレビューアプリの詳細については、「 レビューアプリ」を参照してください。
-
専門家が適切なサブエージェントにアクセスできることを確認します。
- エージェントエンドポイントごとに、専門家に
CAN QUERY
権限を付与します。 - Genieスペースごとに、スペースを操作するためのすべての適切な権限を専門家に付与します。「Genieスペースの共有」を参照してください。
専門家がサブエージェントにアクセスできない場合、スーパーバイザーは会話を終了します。 エンド ユーザーがすべてのサブエージェントではなく一部のサブエージェントにアクセスできる場合、スーパーバイザは、ユーザーがアクセスできないサブエージェントから会話をリダイレクトします。
- エージェントエンドポイントごとに、専門家に
-
データに自分でラベルを付けるには、[ ラベル付けセッションを開く ] をクリックします。
これにより、レビューアプリが新しいタブで開きます。レビュアーとして:
-
レビューを開始 をクリックします。
-
左側で、質問とスーパーバイザーの回答を確認します
-
右側の 期待値 で、既存のガイドラインを確認し、必要に応じて追加します。
- ガイドラインを追加するには、[ + 入力を追加 ] をクリックします。
- 表示されるテキストボックスにガイドラインを入力します。
- 保存 をクリックします。
-
[フィードバック] でフィードバックを入力し、[ 保存 ] をクリックします。
-
タスク シナリオのレビューが完了したら、右上の [次の未レビュー> ] をクリックして、次のシナリオに進みます。
-
すべてのタスク シナリオのレビューが完了したら、レビュー アプリを終了します。
-
-
レビュアーがラベリングセッションを終了したら、スーパーバイザーの「 調整の改善 」タブに戻ります。
-
[マージ] をクリックして、エキスパートからのフィードバックをラベル付けされたデータセットにマージします。右側のタスク シナリオの表は、マージされたフィードバックで更新されます。
-
フィードバック レコードを確認します。
-
AI Playground でスーパーバイザーを再度テストして、調整パフォーマンスの向上を確認します。必要に応じて、別のラベル付けセッションを開始して、ラベル付けされたデータをさらに収集します。
エージェント エンドポイントをクエリする
作成したナレッジアシスタントエンドポイントをクエリするには、複数の方法があります。AI Playground で提供されているコード例を出発点として使用します。
- [ 構成] タブで、[ プレイグラウンドで開く ] をクリックします。
- Playground から [ コードを取得] をクリックします。
- エンドポイントの使用方法を選択します。
- curl を使用してエンドポイントをクエリするコード例として、 [Curl API ] を選択します。
- Python を使用してエンドポイントと対話するためのコード例として、 Python API を選択します。
制限
- Agent Bricks: Knowledge Assistant で作成されたエージェントエンドポイントのみがサポートされています。
- 1 つのスーパーバイザ システムで 10 を超えるエージェントを使用することはできません。
- セキュリティとコンプライアンスの強化が有効になっているワークスペースはサポートされていません。
- トレースを機能させるには、 本番運用 モニタリング for MLflow (Beta) を有効にする必要があります。 「 Databricks プレビューの管理」を参照してください。