基盤モデルの REST API リファレンス

この記事では、Databricks基盤モデルAPIとそれらがサポートするモデルの一般的なAPIの情報を提供します。基盤モデル API は、既存のプロジェクトの移行を容易にするために、OpenAIの REST API と同様に設計されています。トークン単位の従量課金エンドポイントとプロビジョニングスループットエンドポイントはどちらも、同じ REST API リクエスト形式を受け入れます。

エンドポイント

API は、トークン単位の従量課金エンドポイントとプロビジョニングスループットエンドポイントをサポートします。

事前構成されたエンドポイントは、トークン単位の従量課金サポートモデルごとにワークスペースで使用でき、ユーザーは HTTP POST 要求を使用してこれらのエンドポイントと対話できます。サポートされているモデルについては、Mosaic AI Model Servingでサポートされている基盤モデルを参照してください。

プロビジョニングされたスループットエンドポイントは、API または Serving UI を使用して作成できます。これらのエンドポイントは、提供される両方のモデルが同じ API 形式を公開している限り、A/B テストのエンドポイントごとに複数のモデルをサポートします。例えば、どちらのモデルもチャットモデルです。エンドポイント構成パラメーターに関しては、POST /api/2.0/serving-endpoints を参照してください。

リクエストとレスポンスはJSONを使用し、正確なJSON構造はエンドポイントのタスクタイプによって異なります。チャットと完了エンドポイントは、ストリーミング応答をサポートします。

使い方

応答には、要求と応答のトークンの数を報告する usage サブメッセージが含まれます。このサブメッセージの形式は、すべてのタスクタイプで同じです。

フィールド	タイプ	説明
`completion_tokens`	整数タイプ	生成されたトークンの数。埋め込み応答には含まれません。
`prompt_tokens`	整数タイプ	入力プロンプトからのトークンの数。
`total_tokens`	整数タイプ	トークンの合計数。
`reasoning_tokens`	整数タイプ	思考トークンの数。推論モデルにのみ適用できます。

databricks-meta-llama-3-3-70b-instruct のようなモデルの場合、ユーザープロンプトは、モデルに渡される前にプロンプトテンプレートを使用して変換されます。トークン単位の従量課金エンドポイントの場合、システム・プロンプトも追加される場合があります。 prompt_tokens には、サーバーによって追加されたすべてのテキストが含まれます。

レスポンスAPI

重要

Responses API は OpenAI モデルとのみ互換性があります。

Responses API を使用すると、モデルとの複数ターンの会話が可能になります。Chat Completions とは異なり、Responses API はmessagesではなくinput使用します。

レスポンスAPIリクエスト

フィールド	デフォルト	タイプ	説明
`model`		文字列	必須。応答を生成するために使用されるモデル ID。
`input`		文字列またはリスト[ ResponsesInput ]	必須。応答を生成するために使用される、モデルへのテキスト、画像、またはファイル入力。`messages`とは異なり、このフィールドでは`input`を使用して会話の内容を指定します。
`instructions`	`null`	文字列	モデルのコンテキストに挿入されるシステム (または開発者) メッセージ。
`max_output_tokens`	`null`	`null`これは、制限なし、またはゼロより大きい整数を意味します	表示可能な出力トークンや推論トークンなど、応答に対して生成できるトークンの数の上限。
`temperature`	`1.0`	[0,2]の浮動小数点数	サンプリングtemperature。0は決定性で、値が大きくなるほどランダム性が高くなります。
`top_p`	`1.0`	(0,1]のFloat	主要部サンプリングに使用される確率のしきい値。
`stream`	`false`	ブール値	true に設定すると、モデル応答データはサーバー送信イベントを使用して生成され、クライアントにストリームされます。
`stream_options`	`null`	ストリームオプション	ストリーミング応答のオプション。`stream: true`を設定する場合にのみこれを設定します。
`text`	`null`	テキスト設定	モデルからのテキスト応答の構成オプション。プレーンテキストまたは構造化された JSON データにすることができます。
`reasoning`	`null`	推論構成	gpt-5 および o シリーズモデルの推論構成。
`tool_choice`	`"auto"`	文字列または ToolChoiceObject	モデルが応答を生成するときに使用するツール (複数可) を選択する方法。モデルが呼び出すことができるツールを指定する方法については、 `tools`問題をご覧ください。
`tools`	`null`	リスト[ツールオブジェクト]	モデルが応答を生成するときに呼び出す可能性のあるツールの配列。注 : コードインタープリターと Web 検索ツールは Databricks ではサポートされていません。
`parallel_tool_calls`	`true`	ブール値	モデルがツール呼び出しを並列に実行できるようにするかどうか。
`max_tool_calls`	`null`	0 より大きい整数	応答で処理できる組み込みツールへの呼び出しの合計最大数。
`metadata`	`null`	オブジェクト	オブジェクトに添付できる 16 個のキーと値のペアのセット。
`prompt_cache_key`	`null`	文字列	キャッシュヒット率を最適化するために、同様のリクエストの応答をキャッシュするために使用されます。`user`フィールドを置き換えます。
`prompt_cache_retention`	`null`	文字列	プロンプトキャッシュの保持ポリシー。拡張プロンプトキャッシュを有効にするには、 `"24h"`に設定します。これにより、キャッシュされたプレフィックスが最長 24 時間までアクティブに保持されます。
`safety_identifier`	`null`	文字列	使用ポリシーに違反している可能性のあるアプリケーションのユーザーを検出するために使用される安定した識別子。
`user`	`null`	文字列	非推奨です。代わりに`safety_identifier`と`prompt_cache_key`を使用してください。
`truncation`	`null`	文字列	モデル応答に使用する切り捨て戦略。
`top_logprobs`	`null`	整数タイプ	各トークンの位置で返される可能性が最も高いトークンの数を指定する 0 ～ 20 の整数。それぞれにログ確率が関連付けられています。
`include`	`null`	リスト[文字列]	モデル応答に含める追加の出力データを指定します。
`prompt`	`null`	オブジェクト	プロンプトテンプレートとその変数への参照。

サポートされていない問題 : 次の項目はDatabricksでサポートされていないため、指定すると 400 エラーが返されます。

background - バックグラウンド処理はサポートされていません
store - 保存された応答はサポートされていません
conversation - 会話APIはサポートされていません
service_tier - サービス層の選定はDatabricksによって管理されます

`ResponsesInput`

inputフィールドは、役割とコンテンツを持つ文字列または入力メッセージオブジェクトのリストを受け入れます。

フィールド	タイプ	説明
`role`	文字列	必須。メッセージ作成者の役割。`"user"`または`"assistant"`になります。
`content`	文字列またはリスト[ ResponsesContentBlock ]	必須。メッセージの内容。文字列またはコンテンツブロックの配列として表されます。

`ResponsesContentBlock`

コンテンツブロックは、入力メッセージと出力メッセージのコンテンツの種類を定義します。コンテンツブロックのタイプはtypeフィールドによって決まります。

`InputText`

フィールド	タイプ	説明
`type`	文字列	必須です。`"input_text"`する必要があります。
`text`	文字列	必須。テキストの内容。

`OutputText`

フィールド	タイプ	説明
`type`	文字列	必須です。`"output_text"`する必要があります。
`text`	文字列	必須。テキストの内容。
`annotations`	リスト[オブジェクト]	テキストコンテンツのオプションの注釈。

`InputImage`

フィールド	タイプ	説明
`type`	文字列	必須です。`"input_image"`する必要があります。
`image_url`	文字列	必須。画像の URL または base64 でエンコードされたデータ URI。

`InputFile`

フィールド	タイプ	説明
`type`	文字列	必須です。`"input_file"`する必要があります。
`file_id`	文字列	アップロードされたファイルを使用する場合のファイル識別子。
`filename`	文字列	ファイルの名前。
`file_data`	文字列	フォーマットプレフィックス付きの Base64 エンコードされたデータ URI。たとえば、PDF ファイルでは形式`data:application/pdf;base64,<base64 data>`が使用されます。

`FunctionCall`

フィールド	タイプ	説明
`type`	文字列	必須です。`"function_call"`する必要があります。
`id`	文字列	必須。関数呼び出しの一意の識別子。
`call_id`	文字列	必須。通話識別子。
`name`	文字列	必須。呼び出される関数の名前。
`arguments`	オブジェクト/文字列	必須。JSON オブジェクトまたは文字列としての関数の引数。

`FunctionCallOutput`

フィールド	タイプ	説明
`type`	文字列	必須です。`"function_call_output"`する必要があります。
`call_id`	文字列	必須。この出力に対応する呼び出し識別子。
`output`	文字列/オブジェクト	必須。関数は文字列または JSON オブジェクトとして出力します。

`CustomToolCall`

カスタムツールが呼び出されたときに、応答output配列で返されます。関数呼び出しとは異なり、カスタムツール呼び出しは JSON argumentsではなくプレーンテキストinputを返します。

フィールド	タイプ	説明
`type`	文字列	必須です。`"custom_tool_call"`する必要があります。
`id`	文字列	必須。このカスタムツール呼び出しの一意の識別子。
`call_id`	文字列	必須。通話識別子。
`name`	文字列	必須。呼び出されるカスタムツールの名前。
`input`	文字列	必須。ツールはプレーンテキスト（JSON ではない）として入力します。
`status`	文字列	ツール呼び出しのステータス。次のいずれか: `completed` 、 `in_progress` 。

`CustomToolCallOutput`

この入力タイプを使用して、マルチターン会話でカスタムツールのコールバックの結果をモデルに提供します。

フィールド	タイプ	説明
`type`	文字列	必須です。`"custom_tool_call_output"`する必要があります。
`call_id`	文字列	必須。この出力に対応する呼び出し識別子。
`output`	文字列	必須。カスタムツールは文字列として出力します。

`StreamOptions`

ストリーミング応答の構成。stream: trueの場合にのみ使用されます。

フィールド	タイプ	説明
`include_usage`	ブール値	true の場合、ストリームにトークンの使用情報を含めます。デフォルトは`false`です。

`TextConfig`

構造化出力を含むテキスト出力の構成。

フィールド	タイプ	説明
`format`	レスポンスフォーマットオブジェクト	テキスト出力の形式指定。

`ResponsesFormatObject`

テキスト応答の出力形式を指定します。

フィールド	タイプ	説明
`type`	文字列	必須。形式のタイプ: プレーンテキストの場合は`"text"` 、JSON の場合は`"json_object"` 、構造化 JSON の場合は`"json_schema"` 。
`json_schema`	オブジェクト	`type`が`"json_schema"`の場合は必須です。出力の構造を定義する JSON スキーマオブジェクト。

json_schemaオブジェクトは、Chat Completions API に記載されているJsonSchemaObjectと同じ構造を持ちます。

`ReasoningConfig`

推論モデル (o シリーズおよび gpt-5 モデル) での推論動作の構成。

フィールド	タイプ	説明
`effort`	文字列	推論努力レベル: `"low"` 、 `"medium"` 、または`"high"` 。デフォルトは`"medium"`です。
`encrypted_content`	文字列	ステートレスモードの暗号化された推論コンテンツ。以前の回答のモデルによって提供されました。

`ToolObject`

「Databricks での関数呼び出し」を参照してください。

注記

Responses API は次のツールタイプをサポートしています: function 、 custom 、 mcp 、 image_generation 、 shell 。カスタムツールと文法ベースの出力形式は、GPT-5 シリーズモデル ( gpt-5 、 gpt-5.1 、 gpt-5.2 ) でのみ使用できます。

フィールド	タイプ	説明
`type`	文字列	必須。ツールの種類。サポートされている値については上記の注記を参照してください。
`function`	FunctionObject	`type`が`function`の場合は必須です。ツールに関連付けられた関数の定義。
`name`	文字列	`type`が`custom`の場合は必須です。カスタムツールの名前。
`description`	文字列	`type`が`custom`の場合は必須です。カスタムツールの機能の説明。
`format`	カスタムフォーマット	オプション。`type`が`custom`の場合、出力形式を指定します。デフォルトは`{"type": "text"}`です。構造化された出力には`{"type": "grammar", "definition": "<grammar>", "syntax": "lark"}`使用することもできます。GPT-5 シリーズモデルでのみサポートされます。

`CustomToolObject`

カスタムツールを使用すると、モデルは JSON 形式の関数引数ではなく任意の文字列出力を返すことができます。これは、コード生成、パッチの適用、または構造化された JSON が必要ないその他のユースケースに役立ちます。

注記

カスタムツールは、Responses API を通じて GPT-5 シリーズモデル ( gpt-5 、 gpt-5.1 、 gpt-5.2 ) でのみサポートされます。

カスタムツールの例:

JSON
{
  "type": "custom",
  "name": "code_exec",
  "description": "Executes arbitrary Python code. Return only valid Python code."
}

文法付きのカスタムツールの例:

JSON
{
  "type": "custom",
  "name": "apply_patch",
  "description": "Apply a patch to create or modify files.",
  "format": {
    "type": "grammar",
    "definition": "start: begin_patch hunk end_patch\nbegin_patch: \"*** Begin Patch\" LF\n...",
    "syntax": "lark"
  }
}

カスタムツールが呼び出されると、応答には JSON argumentsではなくプレーンテキストinputを含むcustom_tool_call出力項目が含まれます。

`CustomFormat`

文法ベースの出力形式は、GPT-5 シリーズモデルでのみサポートされます。

フィールド	タイプ	説明
`type`	文字列	必須。プレーンテキスト出力の場合は`"text"` 、文法制約付き出力の場合は`"grammar"`いずれか。
`definition`	文字列	`type`が`"grammar"`の場合は必須です。Lark 構文を使用した文法定義文字列。
`syntax`	文字列	`type`が`"grammar"`の場合は必須です。文法構文。現在、 `"lark"`のみがサポートされています。

`FunctionObject`

フィールド	タイプ	説明
`name`	文字列	必須です。呼び出される関数の名前。
`description`	オブジェクト	必須です。関数の詳細な説明。モデルは、この説明を使用して、プロンプトに対する関数の関連性を理解し、より高い精度でツール呼び出しを生成します。
`parameters`	オブジェクト	関数が受け入れるパラメーター (有効な JSON スキーマオブジェクトとして記述されます)。ツールが呼び出された場合、ツール呼び出しは指定された JSON スキーマに適合します。パラメーターを省略すると、パラメーターのない関数が定義されます。 `properties`の数は15キーに制限されています。
`strict`	ブール値	関数呼び出しの生成時に厳密なスキーマ準拠を有効にするかどうか。 `true`に設定すると、モデルは schema フィールドで定義された正確なスキーマに従います。JSON スキーマのサブセットのみがサポートされます (strict が `true`

`ToolChoiceObject`

「Databricks での関数呼び出し」を参照してください。

フィールド	タイプ	説明
`type`	文字列	必須。強制するツールの種類。サポートされる値は、 ToolObject内のツールタイプと一致します: `"function"` 、 `"custom"`など。
`function`	オブジェクト	`type`が`"function"`の場合は必須です。形式が`{"name": "my_function"}`のオブジェクト。ここで、 `"my_function"`は`tools`フィールド内のFunctionObjectの名前です。
`name`	文字列	`type`が`"custom"`の場合は必須です。強制するカスタムツールの名前。GPT-5 シリーズモデルでのみサポートされます。

レスポンスAPIレスポンス

ストリーミング以外のリクエストの場合、レスポンスは単一のレスポンスオブジェクトになります。ストリーミングリクエストの場合、応答はtext/event-streamであり、各イベントは応答チャンクになります。

フィールド	タイプ	説明
`id`	文字列	応答の一意の識別子。注 : Databricks はセキュリティのためにこの ID を暗号化します。
`object`	文字列	オブジェクトの種類。 `"response"`と同じです。
`created_at`	整数タイプ	応答が作成された際の Unix タイムスタンプ (秒単位)。
`status`	文字列	応答のステータス。次のいずれかです: `completed` 、 `failed` 、 `in_progress` 、 `cancelled` 、 `queued` 、または`incomplete` 。
`model`	文字列	応答の生成に使用されたモデルのバージョン。
`output`	リスト[応答メッセージ]	モデルによって生成された出力。通常はメッセージオブジェクトが含まれます。
`usage`	使用量	トークン使用状況メタデータ。
`error`	エラー	応答が失敗した場合のエラー情報。
`incomplete_details`	不完全な詳細	該当する場合、応答が不完全である理由の詳細。
`instructions`	文字列	リクエストで提供される指示。
`max_output_tokens`	整数タイプ	リクエストで指定された最大出力トークン。
`temperature`	Float	生成に使用される温度。
`top_p`	Float	生成に使用される top_p 値。
`tools`	リスト[ツールオブジェクト]	リクエストで指定されたツール。
`tool_choice`	文字列または ToolChoiceObject	リクエストからの tool_choice 設定。
`parallel_tool_calls`	ブール値	並列ツール呼び出しが有効になっているかどうか。
`store`	ブール値	応答が保存されたかどうか。
`metadata`	オブジェクト	応答に添付されたメタデータ。

`ResponsesMessage`

モデルの応答コンテンツを含むoutputフィールド内のメッセージオブジェクト。

フィールド	タイプ	説明
`id`	文字列	必須。メッセージの一意の識別子。
`role`	文字列	必須。メッセージの役割。`"user"`または`"assistant"`いずれかです。
`content`	リスト[ ResponsesContentBlock ]	必須。メッセージ内のコンテンツブロック。
`status`	文字列	メッセージ処理のステータス。
`type`	文字列	必須。オブジェクトの種類。`"message"`と等しい。

`Error`

応答が失敗した場合のエラー情報。

フィールド	タイプ	説明
`code`	文字列	必須。エラーコード。
`message`	文字列	必須。人間が読めるエラーメッセージ。
`param`	文字列	エラーの原因となった問題 (該当する場合)。
`type`	文字列	必須。エラーの種類。

`IncompleteDetails`

応答が不完全である理由の詳細。

フィールド	タイプ	説明
`reason`	文字列	必須。応答が不完全である理由。

チャット完了API

Chat Completions API を使用すると、モデルとの複数ターンの会話が可能になります。モデル応答は、会話内の次のassistantメッセージを提供します。エンドポイントのクエリについては、 POST /serving-endpoints/{name}/invocations を参照してください。

チャットリクエスト

フィールド	デフォルト	タイプ	説明
`messages`		ChatMessage 一覧	必須です。現在の会話を表すメッセージの一覧。
`max_tokens`	`null`	`null`これは、制限なし、またはゼロより大きい整数を意味します	生成するトークンの最大数。
`stream`	`true`	ブール値	要求の部分的な結果を許可するために、応答をクライアントにストリームします。このパラメーターが要求に含まれている場合、応答は Server-sent events 標準を使用して送信されます。
`temperature`	`1.0`	[0,2]の浮動小数点数	サンプリングtemperature。0は決定性で、値が大きくなるほどランダム性が高くなります。
`top_p`	`1.0`	(0,1]のFloat	主要部サンプリングに使用される確率のしきい値。
`top_k`	`null`	`null`これは、制限なし、またはゼロより大きい整数を意味します	top-kフィルタリングに使用する可能性が最も高いkトークンの数を定義します。出力を決定的にするには、この値を1に設定します。
`stop`	[]	文字列または List[文字列]	モデルは、 `stop` 内のシーケンスのいずれかが検出されると、それ以上のトークンの生成を停止します。
`n`	1	0 より大きい整数	`n`が指定されている場合、APIは`n`個の独立したチャット完了を返します。推論の効率とコスト削減をさらに高めるために、同じ入力で複数の入力候補を生成するワークロードに推奨されます。プロビジョニングされたスループットエンドポイントでのみ使用できます。
`tool_choice`	`none`	文字列または ToolChoiceObject	`tools` フィールドと組み合わせてのみ使用されます。`tool_choice` は、 `auto`、 `required`、 `none`などのさまざまなキーワード文字列をサポートしています。`auto` 、使用するツール(存在する場合)をモデルに決定させることを意味します。`auto` では、モデルが`tools`内のツールが関連性がないと判断した場合、モデルはツール呼び出しの代わりに標準のアシスタントメッセージを生成します。`required` 、モデルが `tools` で最も関連性の高いツールを選択し、ツール呼び出しを生成する必要があることを意味します。`none` 、モデルがツール呼び出しを生成せず、代わりに標準のアシスタントメッセージを生成する必要があることを意味します。`tools`で定義されている特定のツールでツール呼び出しを強制するには、`ToolChoiceObject`を使用します。デフォルトでは、 `tools` フィールドが `tool_choice = "auto"`.それ以外の場合、 `tools` フィールドのデフォルトは `tool_choice = "none"`
`tools`	`null`	ツールオブジェクト	モデルが呼び出すことができる `tools` の一覧。現在、サポートされている`tool`タイプは `function` のみで、最大 32 の関数がサポートされています。
`response_format`	`null`	ResponseFormatオブジェクト	モデルが出力する必要がある形式を指定するオブジェクト。使用できるタイプは、 `text`、 `json_schema` 、または `json_object` `{ "type": "json_schema", "json_schema": {...} }`に設定すると、構造化された出力が有効になり、指定したJSONスキーマにモデルが従うようになります。 `{ "type": "json_object" }`に設定すると、モデルが生成する応答は有効な JSON になりますが、応答が特定のスキーマに従うことは保証されません。
`logprobs`	`false`	ブール値	このパラメーターは、トークンがサンプリングされるログ確率を提供するかどうかを示します。
`top_logprobs`	`null`	整数タイプ	このパラメーターは、各サンプリングステップで対数確率を返す可能性が最も高いトークン候補の数を制御します。 0 から 20 まで指定できます。このフィールドを使用する場合は、logprobs``trueする必要があります。
`reasoning_effort`	`"medium"`	文字列	応答を生成するときにモデルが適用する推論作業のレベルを制御します。受け入れられる値は、 `"low"`、 `"medium"`、または `"high"`です。推論の努力が高まると、より思慮深く正確な応答が得られる可能性がありますが、レイテンシーとトークンの使用量が増加する可能性があります。このパラメーターは、 `databricks-gpt-oss-120b` や `databricks-gpt-oss-20b`など、限られたモデルセットでのみ受け入れられます。

`ChatMessage`

フィールド	タイプ	説明
`role`	文字列	必須です。メッセージの作成者の役割。 `"system"`、`"user"`、`"assistant"`、または`"tool"`にすることができます。
`content`	文字列またはリスト [ContentItem]	ツール呼び出しを伴わないチャットタスクに必要です。コンテンツは、文字列または単一のチャットインタラクション内の一連のマルチモーダル要素を含む配列のいずれかです。これらの要素は、モデルによって入力または出力として処理される順序に従います。この配列入力は、外部モデルプロバイダーを通じてのみアクセス可能な独自のモデルで使用するために特別に設計されています。現在、Claude モデルのみがサポートされています。他の外部モデルプロバイダー、オープンソースモデル(Llama)、または Databricksで顧客によってホストされているモデルには、文字列型のコンテンツを使用します。 `list[ContentItem]` はOpenAIの仕様と互換性がありません。
`tool_calls`	ToolCall リスト	モデルによって生成された `tool_calls` の一覧。 `"assistant"`として`role`し、`content`フィールドの指定がない必要があります。
`tool_call_id`	文字列	`role` が `"tool"`の場合、メッセージが応答している`ToolCall`に関連付けられた ID。他の `role` オプションの場合は空にする必要があります。

system ロールは、会話の最初のメッセージとして 1 回だけ使用できます。これは、モデルのデフォルトシステムプロンプトをオーバーライドします。

`ContentItem`

ContentItem は、 TextContent、 ReasoningContent、 DocumentContent、または ImageContent

`TextContent`

フィールド	タイプ	説明
`type`	文字列	必須です。テキストである必要があります。
`text`	文字列	必須のテキストコンテンツ。
`citations`	List[Citation]	オプションの引用情報。次の表を参照してください。
`cache_control`	文字列	リクエストのキャッシュを有効にします。このパラメーターは、Databricks がホストする Claude モデルでのみ受け入れられます。例については、プロンプトのキャッシュを参照してください。

引用フィールドは次のとおりです。

フィールド	タイプ	説明
`type`	文字列	必須です。`char_location`する必要があります。
`cited_text`	文字列	ドキュメントから引用されたテキスト。
`document_index`	整数タイプ	引用されたドキュメントのインデックス。
`document_title`	文字列	引用されたドキュメントのタイトル。
`start_char_index`	整数タイプ	ドキュメント内の引用テキストの開始インデックス。
`end_char_index`	整数タイプ	ドキュメント内の引用テキストの終了インデックス。

`ImageContent`

フィールド	タイプ	説明
`type`	文字列	必須です。`image_url`である必要があります。
`image_url`	ImageURL	OpenAI image_url オブジェクトに相当します。
`cache_control`	文字列	リクエストのキャッシュを有効にします。このパラメーターは、Databricks がホストする Claude モデルでのみ受け入れられます。画像メッセージコンテンツは、エンコードされたデータをソースとして使用する必要があります。URLは現在サポートされていません。例については、プロンプトのキャッシュを参照してください。

ImageURL フィールドは次のとおりです。

フィールド	タイプ	説明
`url`	文字列	Base64 でエンコードされた画像データ。サポートされている画像ファイル形式 (JPEG、PNG、GIF、WebP など) から生成された有効な base64 文字列である必要があります。
`detail`	文字列	画像の詳細レベルを指定します。

`ReasoningContent`

フィールド	タイプ	説明
`type`	文字列	必須です。`reasoning`である必要があります。
`summary`	List[Summary]	推論テキストの内容。サマリーは、 `TextSummary` または `EncryptedTextSummary`
`cache_control`	文字列	リクエストのキャッシュを有効にします。このパラメーターは、Databricks がホストする Claude モデルでのみ受け入れられます。例については、プロンプトのキャッシュを参照してください。

`TextSummary`

フィールド	タイプ	説明
`type`	文字列	必須です。`summary_text`である必要があります。
`text`	文字列	応答を生成するときにモデルによって使用される推論の簡単な要約。
`signature`	文字列	データの信頼性を検証するためのオプションの暗号化トークン。

`EncryptedTextSummary`

フィールド	タイプ	説明
`type`	文字列	必須です。`summary_encrypted_text`である必要があります。
`data`	文字列	安全上の理由から人間が読めない暗号化されたテキストコンテンツ。

`DocumentContent`

DocumentContent はリクエスト専用です。

フィールド	タイプ	説明
`type`	文字列	必須です。`document`する必要があります。
`title`	文字列	ドキュメントのタイトル。
`context`	文字列	ドキュメントの説明。
`source`	ソース	必須です。形式や内容など、ドキュメントに関する詳細情報を指定します。
`citations`	Map[string, bool]	ドキュメントの引用を有効にするかどうかを示すブールにマップする単一のフィールドが "enabled" のマップ。

`Source`

フィールド	タイプ	説明
`type`	文字列	必須です。`base64` (PDF)、`text`、`content`または `url` (URLPDFSource) のいずれかである必要があります。
`media_type`	文字列	PDFおよびテキストタイプに必要です。 - PDFの場合は `application` または `pdf` である必要があります。 - テキストは `text` または `plain` である必要があります。
`data`	文字列	PDFとテキストに必要です。ドキュメントソースを含むデータ。
`content`	文字列 or List[TextContent] または List[ImageContent]	`content`タイプに必要です。ドキュメントの内容。
`url`	文字列	URLPDFSource タイプに必要です。PDF ドキュメントの URL。

`FileContent`

フィールド	タイプ	説明
`type`	文字列	必須です。ファイルである必要があります。
`file`	ファイル	必須ファイルの内容。

ファイルフィールドは以下のとおりです。

フィールド	タイプ	説明
`filename`	文字列	ファイルの名前。
`file_data`	文字列	必須。OpenAI 互換の base64 でエンコードされたファイルデータ。ファイル形式から始まり、その後に base64 でエンコードされたデータが続きます。たとえば、PDF ファイルの形式は`data:application/pdf;base64,<base64 data>`です。
`url`	文字列	公開アクセス可能なファイルの URL。Gemini モデルでのみサポートされます。

`ToolCall`

モデルによるツールコールアクションの提案。「Databricks での関数呼び出し」を参照してください。

フィールド	タイプ	説明
`id`	文字列	必須です。このツール・コールの提案の一意の識別子。
`type`	文字列	必須です。 `"function"`のみがサポートされています。
`function`	FunctionCallCompletion	必須です。モデルによって提案された関数呼び出し。
`cache_control`	文字列	リクエストのキャッシュを有効にします。このパラメーターは、Databricks がホストする Claude モデルでのみ受け入れられます。例については、プロンプトのキャッシュを参照してください。

`FunctionCallCompletion`

フィールド	タイプ	説明
`name`	文字列	必須。モデルが推奨する関数の名前。
`arguments`	オブジェクト	必須。シリアル化された JSON ディクショナリとしての関数の引数。

注 : ToolChoiceObject 、 ToolObject 、およびFunctionObject 、レスポンスAPIセクションで定義されており、両方のAPIs間で共有されます。

`ResponseFormatObject`

「Databricks の構造化出力」を参照してください。

フィールド	タイプ	説明
`type`	文字列	必須です。定義するレスポンス・フォーマットのタイプ。非構造化テキストの場合は `text` 、非構造化 JSON オブジェクトの場合は `json_object` 、特定のスキーマに準拠する JSON オブジェクトの場合は `json_schema` のいずれかです。
`json_schema`	JsonSchemaObject	必須です。 `type` が設定されている場合に遵守する JSON スキーマ `json_schema`

`JsonSchemaObject`

「Databricks の構造化出力」を参照してください。

フィールド	タイプ	説明
`name`	文字列	必須です。応答形式の名前。
`description`	文字列	応答形式での応答方法を決定するためにモデルによって使用される、応答形式の目的の説明。
`schema`	オブジェクト	必須です。レスポンス形式のスキーマ (JSON スキーマオブジェクトとして記述)。
`strict`	ブール値	出力の生成時に厳密なスキーマ準拠を有効にするかどうか。 `true`に設定すると、モデルは schema フィールドで定義された正確なスキーマに従います。JSON スキーマのサブセットのみがサポートされます (strict が `true`

チャット応答

非ストリーミング要求の場合、応答は 1 つのチャット完了オブジェクトです。ストリーミング要求の場合、応答は text/event-stream であり、各イベントは完了チャンクオブジェクトです。完了オブジェクトとチャンクオブジェクトの最上位構造はほとんど同じで、 choices つだけ型が異なります。

フィールド	タイプ	説明
`id`	文字列	チャット完了の一意の識別子。
`choices`	List[ChatCompletionChoice] または List[ChatCompletionChunk] (ストリーミング)	チャット完了テキストのリスト。 `n` パラメーターが指定されている場合は、`n`選択肢が返されます。
`object`	文字列	オブジェクトの種類。非ストリーミングの場合は `"chat.completions"` 、ストリーミングの場合は `"chat.completion.chunk"` のいずれかです。
`created`	整数タイプ	チャットの完了が生成された時間 (秒単位)。
`model`	文字列	応答の生成に使用されたモデルのバージョン。
`usage`	使用量	トークン使用状況メタデータ。ストリーミング応答には存在しない可能性があります。

`ChatCompletionChoice`

フィールド	タイプ	説明
`index`	整数タイプ	生成された選択肢のリスト内の選択肢のインデックス。
`message`	ChatMessage	モデルによって返されたチャット完了メッセージ。役割は `assistant`になります。
`finish_reason`	文字列	モデルがトークンの生成を停止した理由。
`extra_fields`	文字列	外部モデルプロバイダーの独自のモデルを使用する場合、プロバイダーの APIの応答に追加のメタデータが含まれる場合があります。 Databricks はこれらの応答をフィルター処理し、プロバイダーの元のフィールドのサブセットのみを返します。`safetyRating`は、現時点でサポートされている唯一の追加フィールドであり、詳細についてはGeminiのドキュメントを参照してください。

`ChatCompletionChunk`

フィールド	タイプ	説明
`index`	整数タイプ	生成された選択肢のリスト内の選択肢のインデックス。
`delta`	ChatMessage	モデルから生成されたストリーム応答のチャット完了メッセージの一部。最初のチャンクのみが `role` が入力されることが保証されます。
`finish_reason`	文字列	モデルがトークンの生成を停止した理由。最後のチャンクにのみこれが入力されます。

埋め込みAPI

埋め込みタスクは、入力文字列を埋め込みベクトルにマップします。各要求で多くの入力をまとめてバッチ処理できます。エンドポイントパラメーターのクエリについては、 POST /serving-endpoints/{name}/invocations を参照してください。

埋め込みリクエスト

フィールド	タイプ	説明
`input`	文字列または List[文字列]	必須です。埋め込む入力テキスト。文字列または文字列のリストを指定できます。
`instruction`	文字列	埋め込みモデルに渡す省略可能な命令。

手順はオプションであり、モデルによって異なります。たとえば、BGE の作成者は、チャンクのインデックス作成時には命令を使用しないことを推奨し、検索クエリには命令"Represent this sentence for searching relevant passages:"を使用することを推奨しています。Instructor-XL などの他のモデルは、幅広い命令文字列をサポートしています。

埋め込み応答

フィールド	タイプ	説明
`id`	文字列	埋め込みの一意の識別子。
`object`	文字列	オブジェクトの種類。 `"list"`と同じです。
`model`	文字列	埋め込みの作成に使用された埋め込みモデルの名前。
`data`	EmbeddingObject	埋め込みオブジェクト。
`usage`	使用量	トークン使用状況メタデータ。

`EmbeddingObject`

フィールド	タイプ	説明
`object`	文字列	オブジェクトの種類。 `"embedding"`と同じです。
`index`	整数タイプ	モデルによって生成された埋め込みの一覧にある埋め込みのインデックス。
`embedding`	List[Float]	埋め込みベクトル。各モデルは固定サイズのベクトル (BGE-Large の場合は 1024) を返します

完了API

テキスト補完タスクは、1 つのプロンプトに対する応答を生成するためのタスクです。 Chatとは異なり、このタスクはバッチ入力をサポートしており、1つのリクエストで複数の独立したプロンプトを送信できます。エンドポイントパラメーターのクエリについては、 POST /serving-endpoints/{name}/invocations を参照してください。

完了リクエスト

フィールド	デフォルト	タイプ	説明
`prompt`		文字列または List[文字列]	必須です。モデルのプロンプト。
`max_tokens`	`null`	`null`これは、制限なし、またはゼロより大きい整数を意味します	生成するトークンの最大数。
`stream`	`true`	ブール値	要求の部分的な結果を許可するために、応答をクライアントにストリームします。このパラメーターが要求に含まれている場合、応答は Server-sent events 標準を使用して送信されます。
`temperature`	`1.0`	[0,2]の浮動小数点数	サンプリングtemperature。0は決定性で、値が大きくなるほどランダム性が高くなります。
`top_p`	`1.0`	(0,1]のFloat	主要部サンプリングに使用される確率のしきい値。
`top_k`	`null`	`null`これは、制限なし、またはゼロより大きい整数を意味します	top-kフィルタリングに使用する可能性が最も高いkトークンの数を定義します。出力を決定的にするには、この値を1に設定します。
`error_behavior`	`"error"`	`"truncate"` または `"error"`	タイムアウトおよびコンテキスト長超過エラーの場合。 `"truncate"` (できるだけ多くのトークンを返す) と `"error"` (エラーを返す) のいずれかです。このパラメーターは、トークン単位の従量課金エンドポイントでのみ受け入れられます。
`n`	1	0 より大きい整数	`n`が指定されている場合、APIは`n`個の独立したチャット完了を返します。推論の効率とコスト削減をさらに高めるために、同じ入力で複数の入力候補を生成するワークロードに推奨されます。プロビジョニングされたスループットエンドポイントでのみ使用できます。
`stop`	[]	文字列または List[文字列]	モデルは、 `stop` 内のシーケンスのいずれかが検出されると、それ以上のトークンの生成を停止します。
`suffix`	`""`	文字列	すべての入力候補の末尾に追加される文字列。
`echo`	`false`	ブール値	プロンプトと完了を返します。
`use_raw_prompt`	`false`	ブール値	`true`の場合、変換を行わずに`prompt`を直接モデルに渡します。

完了レスポンス

フィールド	タイプ	説明
`id`	文字列	テキスト補完の一意の識別子。
`choices`	CompletionChoice	テキスト入力候補のリスト。渡されたプロンプトごとに、`n`が指定されている場合は`n`選択肢が生成されます。デフォルトの `n` は 1 です。
`object`	文字列	オブジェクトの種類。等しい `"text_completion"`
`created`	整数タイプ	完了が生成された時間 (秒単位)。
`usage`	使用量	トークン使用状況メタデータ。

`CompletionChoice`

フィールド	タイプ	説明
`index`	整数タイプ	要求のプロンプトのインデックス。
`text`	文字列	生成された入力候補。
`finish_reason`	文字列	モデルがトークンの生成を停止した理由。

エンドポイント​

使い方​

レスポンスAPI​

レスポンスAPIリクエスト​

ResponsesInput​

ResponsesContentBlock​

InputText​

OutputText​

InputImage​

InputFile​

FunctionCall​

FunctionCallOutput​

CustomToolCall​

CustomToolCallOutput​

StreamOptions​

TextConfig​

ResponsesFormatObject​

ReasoningConfig​

ToolObject​

CustomToolObject​

CustomFormat​

FunctionObject​

ToolChoiceObject​

レスポンスAPIレスポンス​

ResponsesMessage​

Error​

IncompleteDetails​

チャット完了API​

チャットリクエスト​

ChatMessage​

ContentItem​

TextContent​

ImageContent​

ReasoningContent​

TextSummary​

EncryptedTextSummary​

DocumentContent​

Source​

FileContent​

ToolCall​

FunctionCallCompletion​

ResponseFormatObject​

JsonSchemaObject​

チャット応答​

ChatCompletionChoice​

ChatCompletionChunk​

埋め込みAPI​

埋め込みリクエスト​

埋め込み応答​

EmbeddingObject​

完了API​

完了リクエスト​

完了レスポンス​

CompletionChoice​

追加のリソース​