スーパーバイザーAPI（ベータ版）

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能を有効にできます。Databricksのプレビューを管理するを参照してください。

Supervisor API を使用すると、Databricks 上でカスタムエージェントを簡単に構築でき、長時間実行されるタスク向けのバックグラウンドモードもサポートされます。OpenResponses互換エンドポイント（ POST /mlflow/v1/responses ）への1つのリクエストでモデル、ツール、および手順を定義すると、Databricksがエージェントループを実行します。つまり、モデルを繰り返し呼び出し、ツールを選択して実行し、最終的な応答を合成します。

Databricks上でカスタマイズされたツール呼び出しエージェントを構築するには、次の3つのアプローチがあります。

Agent Bricks Supervisor Agent （推奨）：最高品質を実現するために、人間のフィードバックによる最適化を備えた完全宣言型。
スーパーバイザーAPI ：カスタムエージェントをプログラムで構築します。モデルはで選択し、リクエストごとに使用するツールを制御したり、開発中に反復したりできます。また、エージェントループの管理をDatabricksに任せつつ、モデル選択を制御する必要がある場合にも最適な選択肢です。
AI Gatewayの統合APIまたはネイティブAPIs ：独自のエージェントループを作成します。 DatabricksはLLM推論レイヤーのみを提供します。可能な限り統一されたAPIsを使用してモデルの切り替えを可能にするか、既存のコードをDatabricksに移植する場合やプロバイダー固有の機能を使用する場合は、プロバイダー固有のネイティブAPIs ( /openai 、 /anthropic 、 /gemini ) を使用してください。

要件

お客様のアカウントでは、エージェントおよびLLM向けのUnity AI Gatewayが有効になっています。Databricksのプレビューを管理するを参照してください。
- Supervisor APIはUnity AI Gatewayを介して実行されるため、推論テーブル、レート制限、フォールバックなどのAI Gatewayの機能が適用されます。このベータ版では、利用状況の追跡はサポートされていません。
アカウントに対して有効になっているUnity Catalogに OpenTelemetry トレースを保存します。 Databricksのプレビューを管理するを参照してください。
- Supervisor APIエージェントループからのトレースをUnity Catalogテーブルに保存します。
サポートされているリージョンのDatabricksワークスペース。
ワークスペースでUnity Catalog有効になりました。 Unity Catalog のワークスペースを有効にする方法については、こちらをご覧ください。
渡すツール（ Genie Spaces 、 Unity Catalog機能、 MCPサーバー、ナレッジアシスタント、アプリ）は、既に設定済みでアクセス可能な状態である必要があります。
インストールされたパッケージ： databricks-openaiパッケージ： pip install databricks-openai

ステップ 1: シングルターンLLMコールを作成する

まずはツールを使わない基本的な通話から始めましょう。DatabricksOpenAIクライアントは、ワークスペースのベースURLと認証を自動的に構成します。

Python
from databricks_openai import DatabricksOpenAI

client = DatabricksOpenAI(use_ai_gateway=True)

response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "Tell me about Databricks"}],
  stream=False
)

print(response.output_text)

ステップ 2: ホストされたツールを追加してエージェントループを実行する

リクエストにツールを含めると、Databricks がユーザーに代わって複数回のループ処理を管理します。モデルが呼び出すツールを決定し、Databricks がそれらを実行し、結果をモデルにフィードバックし、モデルが最終的な回答を生成するまでこのプロセスを繰り返します。

Python
response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "Summarize recent customer reviews and flag any urgent issues."}],
  tools=[
    {
      "type": "genie_space",
      "genie_space": {
        "space_id": "<genie-space-id>",
        "description": "Answers customer review questions using SQL"
      }
    },
    {
      "type": "uc_function",
      "uc_function": {
        "name": "<catalog>.<schema>.<function_name>",
        "description": "Flags a review as requiring urgent attention"
      }
    },
    {
      "type": "knowledge_assistant",
      "knowledge_assistant": {
        "knowledge_assistant_id": "<knowledge-assistant-id>",
        "description": "Answers questions from internal documentation"
      }
    },
    {
      "type": "app",
      "app": {
        "name": "<app-name>",
        "description": "Custom application endpoint"
      }
    },
    {
      "type": "uc_connection",
      "uc_connection": {
        "name": "<uc-connection-name>",
        "description": "Searches the web for current information"
      }
    },
  ],
  stream=True
)

for event in response:
  print(event)

ステップ 3 (オプション): システム管理の接続を使用してサードパーティのサービスに接続します

Databricksは、Google Drive、GitHub、Atlassian、SharePoint、Gleanといった人気のあるサードパーティサービス向けに、システム管理された接続を提供します。これらの接続は、独自の外部 MCP サーバーをセットアップするよりも手軽な代替手段です。 uc_connectionツールタイプを使用すれば、自分で構成した任意の外部 MCP サーバーに接続することもできます。

システム管理接続を使用するには、ワークスペースで エージェントベータ版用のサードパーティコネクタを 有効にする必要があります。Databricksのプレビューを管理するを参照してください。

以下のコネクタがサポートされています。

コネクター	説明
`system_ai_agent_google_drive`	Googleドライブからファイルを検索して閲覧できます。
`system_ai_agent_github_mcp`	GitHubのリポジトリ、イシュー、プルリクエストにアクセスできます。
`system_ai_agent_atlassian_mcp`	Atlassianのリソース（Jira、Confluence）を検索および管理します。
`system_ai_agent_sharepoint`	SharePointからファイルを検索して閲覧する。
`system_ai_agent_glean_mcp`	Gleanによってインデックス化された企業コンテンツ全体を検索する。

tools配列内のコネクタを、 uc_connectionツールタイプを使用して渡します。 nameフィールドにはコネクタ名を設定してください。

Python
response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "List my open GitHub pull requests."}],
  tools=[
    {
      "type": "uc_connection",
      "uc_connection": {
        "name": "system_ai_agent_github_mcp"
      }
    }
  ],
)

ユーザー対マシン（U2M）認証

各ユーザーは個別に認証を行う。OAuthクラウドはユーザー間で共有されません。ユーザーが認証していないコネクタを使用する最初のリクエストでは、レスポンスはstatus: "failed"とログインURLを含むoauthエラーで完了します。

JSON
{
  "status": "failed",
  "error": {
    "code": "oauth",
    "message": "Failed request to <connector>. Please login first at <login-url>."
  }
}

ブラウザでURLを開き、OAuth認証フローを完了させた後、同じリクエストを再度実行してください。

ステップ 4 (オプション): クライアント側関数ツールを追加します

アプリケーションでDatabricksホストツールと並行してカスタムロジックを実行したい場合は、 functionツールを使用してください。type: "function" 、 name 、オプションのdescription 、およびJSONスキーマparametersオブジェクトを使用して関数ツールを宣言します。

Python
response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "<user prompt>"}],
  tools=[
    {
      "type": "function",
      "name": "<client-side-function-name>",
      "description": "<description of what this function does>",
      "parameters": {
        "type": "object",
        "properties": {"<param-name>": {"type": "string"}},
        "required": ["<param-names>"],
        "additionalProperties": False,
      },
    }
  ],
)

Supervisor API はリクエスト間で会話状態を保存しないため、クライアント側の関数呼び出しは 2 回のやり取りが必要になります。

ターン1。 このモデルは、最終的な回答の代わりにfunction_call項目（例えば、「 get_weather location=Parisで呼び出す」）を返します。
あなたのコードは 関数をローカルで実行し、結果を生成します。
2. 再度responses.create()を呼び出し、元の入力値とモデルのfunction_callそして結果を含む新しいfunction_call_outputを渡します。このモデルは、その結果を用いて最終的な答えを導き出す。

クライアント側関数ツールの例

Python
import json
from databricks_openai import DatabricksOpenAI

client = DatabricksOpenAI(use_ai_gateway=True)
MODEL = "databricks-claude-sonnet-4-5"

GET_WEATHER = {
    "type": "function",
    "name": "get_weather",
    "description": "Get the current weather for a location.",
    "parameters": {
        "type": "object",
        "properties": {"location": {"type": "string"}},
        "required": ["location"],
        "additionalProperties": False,
    },
}

def run_get_weather(args):
    return json.dumps({
        "location": args["location"],
        "temp_c": 18,
        "condition": "sunny",
    })

CLIENT_TOOLS = {"get_weather": run_get_weather}
TOOLS = [GET_WEATHER]

input_list = [{"role": "user", "content": "What's the weather in Paris?"}]

# Turn 1 — model emits a function_call
resp = client.responses.create(model=MODEL, input=input_list, tools=TOOLS)

# Echo the model's turn into history, then execute pending client function_calls
input_list += [item.model_dump() for item in resp.output]
for item in resp.output:
    if item.type == "function_call" and item.name in CLIENT_TOOLS:
        args = json.loads(item.arguments)
        # Execute the client-side function with the model's arguments
        # and append the result so the model can use it on the next turn.
        tool_output = CLIENT_TOOLS[item.name](args)
        input_list.append({
            "type": "function_call_output",
            "call_id": item.call_id,
            "output": tool_output,
        })

# Turn 2 — model produces the final answer using the tool result
final = client.responses.create(model=MODEL, input=input_list, tools=TOOLS)
print(final.output_text)

その他のパターン（ストリーミング、ホスト型プラスクライアントツール、MCP承認、トラブルシューティング）については、 Supervisor APIクライアント側関数呼び出しスキルを参照してください。

ステップ 5: トレースを有効にする

エージェントループからのトレースをUnity Catalogテーブルに送信するには、リクエストボディにtrace_destinationを渡してください。各リクエストは、モデル呼び出しとツール実行の全シーケンスをキャプチャしたトレースを生成します。trace_destinationを設定しない場合、トレースは書き込まれません。設定の詳細については、 Unity CatalogにOpenTelemetryトレースを保存する」を参照してください。

databricks-openai Pythonクライアントを使用して、 extra_body経由で渡します。

Python
response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "Tell me about Databricks"}],
  tools=[...],
  extra_body={
    &quot;trace_destination&quot;: {
      &quot;catalog_name&quot;: &quot;&lt;catalog&gt;&quot;,
      &quot;schema_name&quot;: &quot;&lt;schema&gt;&quot;,
      &quot;table_prefix&quot;: &quot;&lt;table-prefix&gt;&quot;
    }
  }
)

APIレスポンスにトレースを直接返すには、 extra_bodyに"databricks_options": {"return_trace": True}を渡します。

MLflowの分散トレーシングを使用すると、アプリケーションコードとSupervisor APIエージェントループからのトレースを組み合わせて、単一のエンドツーエンドトレースを作成することもできます。extra_headersフィールドを使用してトレースコンテキストヘッダーを伝播します。

Python
import mlflow
from mlflow.tracing import get_tracing_context_headers_for_http_request

with mlflow.start_span("client-root") as root_span:
  root_span.set_inputs({"input": "Tell me about Databricks"})

  trace_headers = get_tracing_context_headers_for_http_request()

  response = client.responses.create(
    model="databricks-claude-sonnet-4-5",
    input=[{"type": "message", "role": "user", "content": "Tell me about Databricks"}],
    tools=[...],
    extra_body={
      &quot;trace_destination&quot;: {
        &quot;catalog_name&quot;: &quot;&lt;catalog&gt;&quot;,
        &quot;schema_name&quot;: &quot;&lt;schema&gt;&quot;,
        &quot;table_prefix&quot;: &quot;&lt;table-prefix&gt;&quot;
      }
    },
    extra_headers=trace_headers,
  )

バックグラウンドモード

バックグラウンドモードを使用すると、複数のツール呼び出しと複雑な推論を含む長時間実行されるエージェントワークフローを、同期的に完了するのを待つことなく実行できます。background=Trueを指定してリクエストを送信すると、すぐにレスポンス ID が返され、準備ができたら結果をポーリングできます。これは、複数のデータソースにクエリを実行したり、複数のツールを単一のリクエストで連携させたりするエージェントにとって特に役立ちます。

バックグラウンドリクエストを作成する

Python
response = client.responses.create(
  model="databricks-claude-sonnet-4-5",
  input=[{"type": "message", "role": "user", "content": "Tell me about Databricks"}],
  tools=[...],
  background=True,
)

print(response.id)     # Use this ID to poll for the result
print(response.status) # "queued" or "in_progress"

結果に関する投票

状態が最終状態に達するまで、 responses.retrieve()を使用して状態を確認します。

Python
from time import sleep

while response.status in {"queued", "in_progress"}:
  sleep(2)
  response = client.responses.retrieve(response.id)

print(response.output_text)

MCPを使用したバックグラウンドモード

セキュリティ上の理由から、Supervisor APIはバックグラウンドモードでMCPツール呼び出しを実行する前に、ユーザーによる明示的な承認を必要とします。エージェントループがMCPツールを選択すると、応答はmcp_approval_requestで完了します。モデルが渡そうとしているツール名、サーバーラベル、および引数を確認できます。

JSON
{
  "type": "mcp_approval_request",
  "id": "<tool-call-id>",
  "arguments": "{\"query\": \"what is Databricks\", \"count\": 5}",
  "name": "you-search",
  "server_label": "<server-label>",
  "status": "completed"
}

ツール呼び出しを承認してエージェントループを続行するには、会話履歴全体とともにinputフィールドにmcp_approval_responseを返してください。

JSON
{
  "type": "mcp_approval_response",
  "id": "<tool-call-id>",
  "approval_request_id": "<tool-call-id>",
  "approve": true
}

注記

バックグラウンドモードでの応答は、データベースに最大30日間保存されます。

サポートされているツール

リクエストのtools配列でツールを定義します。各エントリは、 typeと、同じキーを持つ構成オブジェクトを指定します。例えば、Genie Spaceツールには"type": "genie_space"と"genie_space": {...}オブジェクトがあります。APIは以下のツールタイプをサポートしています。

ツールタイプ	説明	スコープ
`genie_space`	Genie Spaceに問い合わせて、データに関する質問に答えます。問題: `space_id` 、 `description` 。	`genie`
`uc_function`	エージェントツールとしてUnity Catalog関数を呼び出します。問題: `name` 、 `description` 。	`unity-catalog`
`uc_connection`	Unity Catalog接続を介して外部MCPサーバーに接続します。問題: `name` 、 `description` 。 Databricks で管理されるシステム接続の場合は、 `name` `system_ai_agent_*`コネクタに設定します (ステップ 3 (オプション): システム管理接続を使用してサードパーティサービスに接続するを参照)。注：アプリ上のカスタムMCPサーバーはまだサポートされていません。	`unity-catalog`
`app`	Databricksアプリのエンドポイントを呼び出します。問題: `name` 、 `description` 。	`apps`
`knowledge_assistant`	ナレッジアシスタントのエンドポイントを呼び出します。問題: `knowledge_assistant_id` 、 `description` 。	`model-serving`
`function`	アプリケーションコード内で実行されるクライアント側関数ツールを呼び出します。問題: `name` 、 `description` 、 `parameters` 。	なし

サポートされている

スーパーバイザーAPIへの各リクエストは、以下を受け入れます。

model: 以下のサポート対象モデルのいずれか。このフィールドを変更すると、コードの他の部分を変更せずにプロバイダーを切り替えることができます。
- クロード俳句4.5 （ databricks-claude-haiku-4-5 ）
- クロード作品4.1 （ databricks-claude-opus-4-1 ）
- クロード作品4.5 （ databricks-claude-opus-4-5 ）
- クロード作品4.6 （ databricks-claude-opus-4-6 ）
- クロード・ソネット第4番（ databricks-claude-sonnet-4 ）
- クロード・ソネット4.5 （ databricks-claude-sonnet-4-5 ）
- クロード・ソネット4.6 （ databricks-claude-sonnet-4-6 ）
GPT-5 ( databricks-gpt-5 )
GPT-5.1 ( databricks-gpt-5-1 )
GPT-5.2 ( databricks-gpt-5-2 )
GPT-5.4 ( databricks-gpt-5-4 )
input: 送信する会話メッセージ。
tools: ホストされたツール定義 ( genie_space 、 uc_function 、 knowledge_assistant 、 app 、 uc_connection ) およびクライアント側の関数ツール ( function )。「ステップ 4 (オプション): クライアント側関数ツールを追加する」を参照してください。
instructions監督者の行動を誘導するためのシステムプロンプト。
stream: 応答をストリーミングするには、 trueに設定します。
background: リクエストを非同期で実行するには、 trueに設定してください。responses.retrieve()でポーリングした応答 ID を返します。バックグラウンドモードを参照してください。
trace_destination: catalog_name 、 schema_name 、 table_prefixフィールドを持つオプションのオブジェクト。設定されている場合、Supervisor APIエージェントのループ全体のトレースを、指定されたUnity Catalogテーブルに書き込みます。 Pythonクライアントでextra_body経由で渡します。

API 、 temperatureなどの推論をサポートしていません。サーバーはこれらを内部的に管理します。

制限事項

Supervisor APIには以下の制限事項があります。

バックグラウンドモードの実行時間 : バックグラウンドモードのリクエストの最大実行時間は 30 分です。
バックグラウンドモードでのストリーミング : streamとbackgroundは、同じリクエストで両方ともtrueになることはできません。
永続的な実行 ：エージェントループの実行が一度だけ保証される、障害や中断からの自動回復はサポートされていません。
Databricks Apps OBO はサポートされていません : Supervisor API では、ユーザーに代わって認証を行うことはサポートされていません。Databricks AppsでSupervisor APIを使用するには、システム認証を使用してツールに権限を付与してください。

要件​

ステップ 1: シングルターンLLMコールを作成する​

ステップ 2: ホストされたツールを追加してエージェント ループを実行する​

ステップ 3 (オプション): システム管理の接続を使用してサードパーティのサービスに接続します​

ユーザー対マシン（U2M）認証​

ステップ 4 (オプション): クライアント側関数ツールを追加します​

ステップ 5: トレースを有効にする​

バックグラウンドモード​

バックグラウンドリクエストを作成する​

結果に関する投票​

MCPを使用したバックグラウンドモード​

サポートされているツール​

サポートされている​

制限事項​

次のステップ​

要件