エージェントブリックを使用する: カスタム LLM を使用して、テキスト用のジェネレーション AI エージェントを作成する

備考

ベータ版

この機能はベータ版です。

この記事では、Agent Bricks: Custom を使用して、カスタムテキストベースのタスクの生成エージェントを作成する方法について説明します。AILLM

Agent Bricks は、一般的なAIユースケース向けに、ドメイン固有の高品質なAIエージェントシステムを構築および最適化するためのシンプルなノーコードアプローチを提供します。

カスタムLLMで何ができますか?

Agent Bricksの使用:カスタムLLMを使用して、要約、分類、テキスト変換、コンテンツ生成など、ドメイン固有のタスクに対して高品質の結果を生成します。

Agent Bricks:カスタムLLMは、次のユースケースに最適です。

顧客からの電話の問題と解決策をまとめます。
顧客レビューのセンチメントを分析します。
研究論文をトピックごとに分類する。
新機能のプレスリリースを生成します。

高レベルの指示と例を前提として、Agent Bricks: Custom LLM は、ユーザーに代わってプロンプトを最適化し、評価基準を自動的に推測し、提供されたデータからシステムを評価し、モデルを運用可能なエンドポイントとしてデプロイします。

Agent Bricks: Custom LLM は、MLflow や Agent Evaluation などの自動評価機能を活用して、特定の抽出タスクのコストと品質のトレードオフを迅速に評価できます。この評価により、精度とリソース投資のバランスについて、十分な情報に基づいた決定を下すことができます。

必要条件

サーバレスがサポートするワークスペースには、次のものが含まれます。
- ワークスペースで Unity Catalog が有効になっている。
- パートナーが提供する AI 支援機能がワークスペースで有効になっています。
- サポートされているリージョン ( us-east-1 または us-west-2のいずれかのリージョンのワークスペース。
- Mosaic AI Model Servingへのアクセス。
- system.aiスキーマを使用した Unity Catalog の基盤モデルへのアクセス。
- 非ゼロの予算を持つサーバレス予算ポリシーへのアクセス。
ai_query SQL関数を使用する機能。
入力データを使用する準備ができている必要があります。次のいずれかを選択できます。
- Unity Catalog テーブル。テーブル名には、特殊文字 ( -など) を含めることはできません。
- 少なくとも 3 つの入力と出力の例。このオプションを選択する場合は、エージェントの Unity Catalog スキーマの宛先パスを指定する必要があり、このスキーマに対する CREATE REGISTERED MODEL と CREATE TABLE のアクセス許可が必要です。
エージェントを最適化するには、少なくとも 100 個の入力 (Unity Catalog テーブルの 100 行、または手動で提供された 100 個の例) が必要です。

カスタム LLM エージェントを作成する

ワークスペースの左側のナビゲーションウィンドウでエージェントに移動し、 カスタム LLM をクリックします。

ABCL タスク。

ステップ 1: エージェントを構成する

「構成 」タブで、「 >例を表示 」をクリックして、カスタム LLM エージェントの入力およびモデル応答の例を展開します。

下のペインで、エージェントを設定します。

「タスクの説明」 に、専門化タスクの目的や望ましい結果など、明確で詳細な説明を入力します。
ラベル付きデータセット、ラベルなしデータセット、またはエージェントの作成に使用するいくつかの例を提供します。

サポートされているデータ型は、 string、 int、および doubleです。

タブ :::タブ-item[Labeled データセット] 「ラベル付きデータセット 」を選択した場合:
1. [データセットを UC テーブルとして選択] で [ 参照 ] をクリックし、使用する Unity Catalog のテーブルを選択します。テーブル名には、特殊文字 ( -など) を含めることはできません。
  
  次に例を示します。
  
  main.model_specialization.customer_call_transcripts
2. 入力列 フィールドで、入力テキストとして使用する列を選択します。ドロップダウンメニューには、選択したテーブルの列が自動的に入力されます。
3. [ 出力列 (オプション)] で、予想される変換の出力例として指定する列を選択します。このデータを提供することで、ドメイン固有のニーズにより正確に適応するようにエージェントを設定できます。:::
タブ-item[Unlabeled データセット] Unlabeled データセット を選択した場合:
1. [データセットを UC テーブルとして選択] で [ 参照 ] をクリックし、使用する Unity Catalog のテーブルを選択します。テーブル名には、特殊文字 ( -など) を含めることはできません。
2. 入力列 フィールドで、入力テキストとして使用する列を選択します。ドロップダウンメニューには、選択したテーブルの列が自動的に入力されます。 :::
タブ-item[いくつかの例] 「いくつかの例 」を選択した場合:
1. 専門化タスクの入力と期待されるアウトプットの例を少なくとも3つ提供してください。高品質の例を提供することで、専門化エージェントを設定して要件をより深く理解することができます。
2. さらに例を追加するには、[ + 追加 ] をクリックします。
3. [エージェントの宛先 ] で、評価データを含むテーブルの作成を Agent Bricks で支援する Unity Catalog スキーマを選択します。このスキーマに対する CREATE REGISTERED MODEL 権限と CREATE TABLE 権限が必要です。::: ::::
エージェントに名前を付けます。
エージェントの作成 をクリックします。

ステップ 2: エージェントを構築して改善する

ビルド タブでは、エージェントを改善するための推奨事項を確認したり、サンプルモデルの出力を確認したり、タスクの指示と評価基準を調整したりできます。

レコメンデーション ペインでは、Databricksエージェントの評価メトリクスを定義し、サンプルの応答を良好または不良として評価するのに役立つレコメンデーションが提供されます。

エージェントのパフォーマンスを最適化するための Databricks の推奨事項を確認します。
推奨される評価基準を確認します。これらの推奨される評価基準は、エージェントの最適化に役立つように自動的に推論されます。

各推奨事項について、次の操作を行います。
- 推奨事項を受け入れるには、はいを選択します。これにより、 エージェント構成 ペインに評価基準が追加されます。
- 基準を拒否するには、[ いいえ ] を選択します。
- 推奨事項を 無視する こともできます。
[結果の確認 ] で、サンプルモデルの入力と出力を確認し、必要に応じて人間によるフィードバックを提供します。この評価は、モデルの応答を改善するのに役立ちます。

各サンプルについて、良好な応答であったかどうかを選択します。 いいえ の場合は、応答に関するフィードバックをオプションで提供し、保存をクリックして次のフィードバックに進みます。
推奨事項の確認が完了したら、 エージェント構成 ウィンドウを確認します。
1. タスクの指示をより具体的に調整して、モデルのパフォーマンスを向上させることができます。
2. 推奨事項から追加した評価基準を確認します。条件を削除するには、[ X ] をクリックします。
3. 評価基準をさらに追加する場合は、[ + 追加 ] をクリックして独自の評価基準を追加します。
[ エージェントの更新 ] をクリックして、これらの変更をエージェントに保存します。 [結果の確認 ] の下の例が更新され、新しいモデル出力の例が表示されます。

ステップ 3: エージェントを試して最適化する

Databricks 全体のワークフローでエージェントをお試しください。

使用タブで、

[ SQL で試す ] をクリックして SQL エディターを開き、ai_query を使用して新しいカスタム LLM エージェントに要求を送信します。
(オプション)エージェントのコストを最適化する場合は、[ 最適化 ]をクリックします。
- 最適化には、少なくとも 100 個の入力が必要です。Unity Catalog データセットを指定した場合、テーブルには少なくとも 100 行が含まれている必要があります。データセットを提供しなかった場合は、少なくとも 100 個の例を提供する必要があります。
- 最適化には約 1 時間かかる場合があります。
- 最適化が進行中の場合、現在アクティブなエージェントへの変更がブロックされます。

最適化が完了すると、[ レビュー ] タブに移動し、現在アクティブなエージェントとコストに最適化されたエージェントの比較が表示されます。(オプション) ステップ 4: 最適化されたエージェントを確認してデプロイするを参照してください。

(オプション)[ パイプラインの作成 ] を選択して、スケジュールされた間隔で実行される DLT パイプラインをデプロイし、新しいデータでエージェントを使用します。パイプラインの詳細については LakeFlow Declarative パイプラインを参照してください。

CL エージェントを使用または最適化するか、パイプラインを作成します。

(オプション)ステップ 4: 最適化されたエージェントを確認してデプロイする

Databricks では、エージェントを最適化するために、少なくとも 100 個の入力 ( Unity Catalog テーブルの 100 行または手動で提供された 100 個の例) をお勧めします。入力を追加すると、エージェントが学習できるナレッジベースが増え、エージェントの品質と応答精度が向上します。

[ 使用 ] タブで 最適化 を選択すると、Databricks は複数の異なる最適化戦略を比較して、最適化されたエージェントをビルドしてデプロイします。これらの戦略には、 Databricks Geosを使用する基盤モデルファインチューニングが含まれます。

レビュー タブで、

評価結果 で、最適化されたエージェントの評価メトリクスを確認できます。評価を実行するために、 Databricks は Build タブで定義した評価基準に基づいてメトリクスを使用します
リクエストをクリックすると、詳細が開きます。ここでは、各評価メトリクスの詳細な評価を、合格または不合格の理由を含む形でご覧いただけます。これには、Databricksの組み込み AI ジャッジが使用されます。また、入力と応答を検査することもできます。
これらの結果を確認したら、[ Deploy best model to an endpoint ] で最適なモデルを選択し、[ Deploy] をクリックします。

制限

Databricks では、エージェントを最適化するために、少なくとも 100 個の入力 ( Unity Catalog テーブルの 100 行または手動で提供された 100 個のサンプル) を推奨しています。入力を追加すると、エージェントが学習できるナレッジベースが増え、エージェントの品質と応答精度が向上します。
Unity Catalogテーブルを指定する場合、テーブル名に特殊文字 (-など) を含めることはできません。
入力としてサポートされているデータ型は、 string、 int、および doubleのみです。
現在、使用容量は 1 分あたり 100k の入力トークンと出力トークンに制限されています。
PrivateLink を使用するワークスペース (PrivateLink の背後にあるストレージを含む) はサポートされていません。

カスタムLLMで何ができますか?​

必要条件​

カスタム LLM エージェントを作成する​

ステップ 1: エージェントを構成する​

ステップ 2: エージェントを構築して改善する​

ステップ 3: エージェントを試して最適化する​

(オプション)ステップ 4: 最適化されたエージェントを確認してデプロイする​

制限​