AI Builder: モデルの専門化を使用して、テキスト用の生成 AI エージェントを作成する
ベータ版
この機能は ベータ版です。
この記事では、AI Builder: モデル専門化 を使用して、カスタム テキストベースのタスクの生成AIエージェントを作成する方法について説明します。
AI Builder は、一般的な AI ユースケース向けに、ドメイン固有の高品質な AI エージェント システムを構築および最適化するためのシンプルなノーコード アプローチを提供します。
モデルの専門化で何ができるの?
AI Builder の使用: モデルの専門化を使用して、要約、分類、テキスト変換、コンテンツ生成など、ドメイン固有のタスクに対して高品質の結果を生成します。
モデルの専門化の例は次のとおりです。
- 顧客からの電話の問題と解決策をまとめます。
- 顧客レビューのセンチメントを分析します。
- 研究論文をトピックごとに分類する。
- 新機能のプレス リリースを生成します。
高レベルの指示と例を前提として、AI Builder: モデルの専門化 は、ユーザーに代わってプロンプトを最適化し、評価基準を自動的に推測し、提供されたデータからシステムを評価し、モデルを運用可能なエンドポイントとしてデプロイします。
AI Builder: モデルの専門化では、MLflow や Agent Evaluation などの自動評価機能を活用して、特定の抽出タスクのコストと品質のトレードオフを迅速に評価できます。この評価により、精度とリソース投資のバランスについて、十分な情報に基づいた決定を下すことができます。
必要条件
-
サーバレスがサポートするワークスペースには、次のものが含まれます。
- ワークスペースで Unity Catalog が有効になっている。
- パートナーが提供する AI 支援機能が ワークスペースで有効になっています。
- サポートされているリージョン (
us-east-1
またはus-west-2
のいずれかのリージョンのワークスペース。 - Mosaic AI Model Servingへのアクセス。
system.ai
スキーマを使用した Unity Catalog の基盤モデルへのアクセス。- ゼロ以外の 予算を持つサーバレス 予算ポリシー へのアクセス。
-
ai_query
SQL関数を使用する機能。 -
入力データを使用する準備ができている必要があります。次のいずれかを選択できます。
- Unity Catalog テーブル。テーブル名には、特殊文字 (
-
など) を含めることはできません。 - 少なくとも 3 つの入力と出力の例。このオプションを選択する場合は、エージェントの Unity Catalog スキーマの宛先パスを指定する必要があり、このスキーマに対する CREATE REGISTERED MODEL と CREATE TABLE のアクセス許可が必要です。
- Unity Catalog テーブル。テーブル名には、特殊文字 (
-
エージェントを最適化するには、少なくとも 100 個の入力 (Unity Catalog テーブルの 100 行、または手動で提供された 100 個の例) が必要です。
モデル専門化エージェントを作成する
ワークスペースの左側のナビゲーション ウィンドウで AI Builder に移動し、 モデルの専門化 をクリックします。
ステップ 1: エージェントを構成する
構成 タブで、 >例を表示 をクリックして、モデル専門化エージェントの入力例とモデル応答を展開します。
下のペインで、エージェントを設定します。
-
「タスクの説明」 に、専門化タスクの目的や望ましい結果など、明確で詳細な説明を入力します。
-
[ データはありますか? ] で、[ はい ] または [いいえ ] を選択します。
サポートされているデータ型は、
string
、int
、およびdouble
です。はい を選択した場合:
-
[データセットの選択] で [ 参照 ] をクリックし、使用する Unity Catalog のテーブルを選択します。このデータセットは、エージェントの作成に使用され、ラベル付けすることもラベル付けしないこともできます。テーブル名には、特殊文字 (
-
など) を含めることはできません。次に例を示します。
main.model_specialization.customer_call_transcripts
-
入力列 フィールドで、入力テキストとして使用する列を選択します。ドロップダウンメニューには、選択したテーブルの列が自動的に入力されます。
-
(オプション) 出力列 (オプション) で、予想される変換の出力例として指定する列を選択します。このデータを提供することで、ドメイン固有のニーズにより正確に適応するようにエージェントを設定できます。
いいえ を選択した場合:
- 専門化タスクの入力と期待されるアウトプットの例を少なくとも3つ提供してください。 高品質の例を提供することで、専門化エージェントを設定して要件をより深く理解することができます。
- さらに例を追加するには、[ + 追加 ] をクリックします。
- エージェントの宛先 で、評価データを含むテーブルの作成を AI Builder で支援する Unity Catalog スキーマを選択します。このスキーマに対する CREATE REGISTERED MODEL 権限と CREATE TABLE 権限が必要です。
-
-
エージェントに名前を付けます。
-
エージェントの作成 をクリックします。
ステップ 2: エージェントを構築して改善する
ビルド タブでは、エージェントを改善するための推奨事項を確認したり、サンプル モデルの出力を確認したり、タスクの指示と評価基準を調整したりできます。
レコメンデーション ペインでは、Databricksエージェントの評価メトリクスを定義し、サンプルの応答を良好または不良として評価するのに役立つレコメンデーションが提供されます。
-
エージェントのパフォーマンスを最適化するための Databricks の推奨事項を確認します。
-
推奨される評価基準を確認します。これらの推奨される評価基準は、エージェントの最適化に役立つように自動的に推論されます。
各推奨事項について、次の操作を行います。
- 推奨事項を受け入れるには、 はい を選択します。これにより、 エージェント構成 ペインに評価基準が追加されます。
- 基準を拒否するには、[ いいえ ] を選択します。
- 推奨事項を 無視する こともできます。
-
サンプル モデルの入力と出力を確認し、必要に応じて人間によるフィードバックを提供します。この評価は、モデルの応答を改善するのに役立ちます。
各サンプルについて、良好な応答であったかどうかを選択します。 いいえ の場合は、応答に関するフィードバックをオプションで提供し、 保存 をクリックして次のフィードバックに進みます。
-
推奨事項の確認が完了したら、 エージェント構成 ウィンドウを確認します。
- タスクの指示をより具体的に調整して、モデルのパフォーマンスを向上させることができます。
- 推奨事項から追加した評価基準を確認します。条件を削除するには、[ X ] をクリックします。
- 評価基準をさらに追加する場合は、[ + 追加 ] をクリックして独自の評価基準を追加します。
-
[ エージェントの更新 ] をクリックして、これらの変更をエージェントに保存します。 モデル出力の確認 の下の例が更新され、新しいモデル出力の例が表示されます。
ステップ 3: エージェントを試して最適化する
Databricks 全体のワークフローでエージェントをお試しください。
使用 タブで、
-
[ SQL で試す ] をクリックして SQL エディターを開き、
ai_query
を使用して新しい モデル専門化エージェントに要求を送信します。 -
(オプション)エージェントのコストを最適化する場合は、[ 最適化 ]をクリックします。
- 最適化には、少なくとも 100 個の入力が必要です。Unity Catalog データセットを指定した場合、テーブルには少なくとも 100 行が含まれている必要があります。データセットを提供しなかった場合は、少なくとも 100 個の例を提供する必要があります。
- 最適化には約 1 時間かかる場合があります。
- 最適化が進行中の場合、現在アクティブなエージェントへの変更がブロックされます。
最適化が完了すると、[ レビュー ] タブに移動し、現在アクティブなエージェントとコストに最適化されたエージェントの比較が表示されます。(オプション) ステップ 4: 最適化されたエージェントを確認してデプロイするを参照してください。
(オプション)ステップ 4: 最適化されたエージェントを確認してデプロイする
Databricks では、エージェントを最適化するために、少なくとも 100 個の入力 ( Unity Catalog テーブルの 100 行または手動で提供された 100 個の例) をお勧めします。 入力を追加すると、エージェントが学習できるナレッジ ベースが増え、エージェントの品質と応答精度が向上します。
[ 使用 ] タブで 最適化 を選択すると、Databricks は複数の異なる最適化戦略を比較して、最適化されたエージェントをビルドしてデプロイします。これらの戦略には、 Databricks Geosを使用する基盤モデル ファインチューニングが含まれます。
レビュー タブで、
- 評価結果 で、最適化されたエージェントの評価メトリクスを確認できます。評価を実行するために、 Databricks は Build タブで定義した評価基準に基づいてメトリクスを使用します
- リクエストをクリックすると、詳細が開きます。ここでは、各評価メトリクスの詳細な評価を、合格または不合格の理由を含む形でご覧いただけます。 これには、Databricksの 組み込み AI ジャッジが使用されます。また、入力と応答を検査することもできます。
- これらの結果を確認したら、最適化されたエージェントを使用できます。
制限
- Databricks では、エージェントを最適化するために、少なくとも 100 個の入力 ( Unity Catalog テーブルの 100 行または手動で提供された 100 個のサンプル) を推奨しています。 入力を追加すると、エージェントが学習できるナレッジ ベースが増え、エージェントの品質と応答精度が向上します。
- Unity Catalogテーブルを指定する場合、テーブル名に特殊文字 (
-
など) を含めることはできません。 - 入力としてサポートされているデータ型は、
string
、int
、およびdouble
のみです。 - 現在、使用容量は 1 分あたり 100k の入力トークンと出力トークンに制限されています。
- PrivateLink を使用するワークスペース (PrivateLink の背後にあるストレージを含む) はサポートされていません。