メインコンテンツまでスキップ

Databricks でサポートされている基盤モデル

備考

ベータ版

この機能はベータ版です。アカウント管理者は、アカウント コンソールの [プレビュー] ページからこの機能へのアクセスを制御できます。 Databricksのプレビューを管理するを参照してください。

この記事では、Unity AI Gatewayのモデルサービスを通じてクエリできる、最先端のDatabricksホスト型基盤モデルについて説明します。

Databricks は、これらの各モデルに対して、systemカタログおよびaiスキーマ (system.ai) 内に、すぐに使用できるシステム提供のモデルサービスを提供します。モデルサービスをモデルスラグとして完全修飾名で識別し(例: system.ai.claude-sonnet-4-5)、リクエストをワークスペースの Unity AI Gateway ベース URL (https://<workspace-url>/ai-gateway/mlflow/v1) に送信します。

注記

これらのモデルとサービスの地域と機能の可用性については、「モデルサービング機能の可用性」を参照してください。

これらのモデルをUnity AI Gatewayのモデルサービスとしてクエリーします。「基盤モデルのクエリー」でクエリーオプションを、そして利用可能なモデルサービスを見つけるには「基盤モデルの検出」を参照してください。

AI Playground を使用して、これらのサポートされているモデルと対話できます。

OpenAI GPT-5.5 Pro

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

GPT-5.5 Pro は拡張プロンプトキャッシングを使用します。キャッシュされたテンソルは、GPUローカルストレージに24時間まで保存されます。

モデルサービス名system.ai.gpt-5-5-pro

対応入力 :テキスト、画像

GPT-5.5 Proは、GPT-5.5のより高精度なバリアントであり、深い研究、高度な数学、高リスクな推論など、最も困難な問題に対処することを目的としています。このモデルはマルチモーダル入力をサポートし、400Kの総トークンコンテキストウィンドウと最大128Kの出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.5 Proの出力は一部の事実を省略し、場合によっては誤った情報を生成する可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.5

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

GPT-5.5 は、拡張プロンプトキャッシングを使用します。キャッシュされたテンソルは、GPUローカルストレージに24時間まで保存されます。

モデルサービス名system.ai.gpt-5-5

対応入力 :テキスト、画像

GPT-5.5 は、エンタープライズエージェントのワークフロー、複雑なドキュメントの推論、および長期的なコーディングエージェント向けの OpenAI の最も強力な最先端モデルです。GPT-5.5 は、OpenAI のコーディングエージェントである Codex を基盤としています。このモデルはマルチモーダル入力をサポートし、400K の合計トークンコンテキストウィンドウと最大 128K の出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.5 の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.4

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-4

対応入力 :テキスト、画像

GPT-5.4 は、OpenAI によって開発された推論機能を備えた汎用の大規模言語モデルです。複雑なタスクでのパフォーマンスが向上し、正確性が高まり、より意図的な段階的推論が可能になります。このモデルはマルチモーダル入力をサポートし、400K の合計トークンコンテキストウィンドウと最大 128K の出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.4の出力は一部の事実を省略したり、時折誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.4 mini

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-4-mini

対応入力 :テキスト、画像

GPT-5.4 mini は、OpenAI によって開発された、コスト最適化された推論機能を備えた汎用大規模言語モデルです。GPT-5.4に基づいて構築このアーキテクチャのモデルは、信頼性の高い推論、正確な言語、迅速な出力を必要とする明確に定義されたタスクでパフォーマンスが向上します。マルチモーダル入力をサポートし、400Kの合計トークンコンテキストウィンドウと128Kの最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.4 miniの出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricksでは、精度が特に重要なシナリオでは、Retrieval Augmented Generation (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.4 nano

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-4-nano

対応入力 :テキスト、画像

GPT-5.4 nano は、OpenAI によって開発された推論機能を備えた汎用大規模言語モデルです。GPT-5.4 をベースに構築されていますアーキテクチャにより、このモデルは、通常のビジネスプロセスやモバイルアプリケーション向けのシンプルな指示実行や分類などの高スループットのタスクに優れています。マルチモーダル入力をサポートし、400K トークンの合計コンテキスト ウィンドウと128Kの最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.4 nano の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.3 Codex

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

注記

このモデルはAI Playgroundではサポートされていません。このモデルと対話するには、Responses API を使用してください。

モデルサービス名system.ai.gpt-5-3-codex

対応入力 :テキスト、画像

GPT-5.3 Codexは、OpenAIの最も先進的なエージェント型コーディングモデルであり、研究、ツールの使用、および実行を伴う複雑で長時間のタスクを処理するように設計されています。GPT-5.2の最先端のコーディング性能を組み合わせています。GPT-5.2の推論能力と専門知識を備えたCodexは、25%高速に動作します。このモデルはマルチモーダル入力をサポートし、400Kの合計トークンコンテキストウィンドウと128Kの最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.3Codex の出力では、一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.2 Codex

重要
  • 顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

  • OpenAI GPT-5.2Codexは2026年7月16日に廃止されます。推奨される代替モデルと、廃止期間中に移行する方法に関するガイダンスについては、廃止されたモデルを参照してください。

注記

このモデルはAI Playgroundではサポートされていません。このモデルと対話するには、Responses API を使用してください。

モデルサービス名system.ai.gpt-5-2-codex

対応入力 :テキスト、画像

GPT-5.2 Codexは、GPT-5.2アーキテクチャ上に構築されたコード特化型の大規模言語モデルで、強化されたコーディング機能を備え、コード生成、リファクタリング、デバッグ、ソフトウェアエンジニアリングタスクに優れています。このモデルはマルチモーダル入力をサポートし、合計400Kトークンのコンテキストウィンドウと最大128Kの出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.2Codex の出力では、一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.2

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-2

対応入力 :テキスト、画像

GPT-5.2 は、OpenAI によって開発された推論機能を備えた汎用の大規模言語モデルです。このモデルは、GPT-5.1 を直接基盤としており、精度が高く、中程度から複雑なタスクでのトークン効率が向上し、より計画的な足場が組まれた推論を提供します。このモデルは、構造化された抽出、マルチステップのワークフロー、マルチモーダル タスクに優れています。マルチモーダル入力をサポートし、400K の総トークン コンテキスト ウィンドウと 128K の最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.2の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricksでは、精度が特に重要なシナリオで検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.1

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-1

対応入力 :テキスト、画像

GPT-5.1 は、OpenAI によって開発された、推論機能を備えた汎用大規模言語モデルです。このモデルは、高速な会話や深い推論のためのインスタントモードと思考モードの両方を備えており、シンプルまたは複雑なタスクに合わせて自動的に調整されます。このモデルは、コンテンツ作成、指導、テクニカルサポート、コーディングに優れており、以前のバージョンよりも厳格なプロンプトエンジニアリングへの依存度が低くなっています。これはマルチモーダル入力をサポートし、合計400Kトークンのコンテキストウィンドウと最大128Kの出力トークンを備えています。GPT-5.1 の詳細をご覧ください。

他の大規模言語モデルと同様に、GPT-5.1の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.1 Codex Max

重要
注記

このモデルはAI Playgroundではサポートされていません。このモデルと連携するために、Responses APIを使用できます。

モデルサービス名system.ai.gpt-5-1-codex-max

対応入力 :テキスト、画像

GPT-5.1 Codex Max は、OpenAI の高性能なコード特化型大規模言語モデルです。GPT-5.1 アーキテクチャ上に構築され、最大限のコーディング パフォーマンスを備えたこのモデルは、複雑なコード生成、大規模なリファクタリング、エンタープライズ ソフトウェア エンジニアリングのタスクに優れています。マルチモーダル入力をサポートし、400K の合計トークンコンテキストウィンドウと 128K の最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.1 Codex Maxの出力は一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5.1 Codex Mini

重要
注記

このモデルはAI Playgroundではサポートされていません。このモデルと連携するために、Responses APIを使用できます。

モデルサービス名system.ai.gpt-5-1-codex-mini

対応入力 :テキスト、画像

GPT-5.1 Codex Mini は、OpenAI のコスト最適化されたコード特化型大規模言語モデルです。効率的なコーディング機能を備えたGPT-5.1アーキテクチャに基づいて構築されており、コード補完、シンプルなリファクタリング、日常のコーディングタスクに優れています。マルチモーダル入力をサポートし、400K の合計トークンコンテキストウィンドウと 128K の最大出力トークンを備えています。

他の大規模言語モデルと同様に、GPT-5.1 Codex Miniの出力は一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5

対応入力 :テキスト、画像

GPT-5は、OpenAIによって構築およびトレーニングされた最先端の汎用大規模言語モデルおよび推論モデルです。マルチモーダル入力をサポートし、合計400Kトークンのコンテキストウィンドウと最大128Kの出力トークンを備えています。このモデルは、コーディング、チャット、推論、エージェント主導型タスクのために構築されています。

他の大規模言語モデルと同様に、GPT-5の出力は一部の事実を省略し、場合によっては誤った情報を生成する可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5 mini

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-mini

対応入力 :テキスト、画像

GPT-5 miniは、OpenAIによって構築およびトレーニングされた、最先端の汎用大規模言語モデルおよび推論モデルです。マルチモーダル入力をサポートし、400Kの合計トークンコンテキストウィンドウと128Kの最大出力トークンを備えています。このモデルは、推論およびチャットワークロード向けにコスト最適化されており、信頼性の高い推論、正確な言語、およびテキストや画像に対する迅速な出力を必要とする明確に定義されたタスクで優れた性能を発揮します。

他の大規模言語モデルと同様に、GPT-5の出力は一部の事実を省略し、場合によっては誤った情報を生成する可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

OpenAI GPT-5 nano

重要

顧客は、適用されるモデルの規約へのコンプライアンスを確保する責任があります。

モデルサービス名system.ai.gpt-5-nano

対応入力 :テキスト、画像

GPT-5 nano は、OpenAI によって構築およびトレーニングされた最先端の汎用大規模言語モデルおよび推論モデルです。マルチモーダル入力をサポートし、128K の最大出力トークンを備えた 400K の合計トークンコンテキストウィンドウを特徴としています。このモデルは、日常的なビジネスプロセスやモバイルアプリケーション向けのシンプルな命令実行や分類などの高スループットタスクに優れています。

他の大規模言語モデルと同様に、GPT-5の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 3.1 Flash Lite

重要

Gemini 3.1 Flash Lite については、適用されるモデルの条件を参照してください。

このモデルはグローバルエンドポイントでホストされており、クロスジオルーティングを有効にする必要があります。

モデルサービス名system.ai.gemini-3-1-flash-lite

対応入力 :テキスト、画像、動画、音声

Gemini 3.1 Flash Liteは、Googleによって開発およびトレーニングされたGemini 3シリーズで最速かつ最もコスト効率の高いモデルです。大規模なインテリジェンス向けに構築されており、このモデルは画像機能、関数呼び出し、構造化出力を備えたマルチモーダル入力をサポートします。Gemini 3.1 Flash Liteは、高スループットで費用対効果の高いデプロイ向けに最適化されています。Gemini 3.1 Flash Liteの詳細をご覧ください

他の大規模言語モデルと同様に、Gemini 3.1 Flash Lite の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオで検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 3.5 Flash

重要

Gemini 3.5 Flash の適用されるモデル規約を参照してください。

このモデルでは、米国およびEU以外の地域でクロスジオルーティングを有効にする必要があります。

モデルサービス名system.ai.gemini-3-5-flash

対応入力 :テキスト、画像、動画、音声

Gemini 3.5 Flashは、Googleによって開発およびトレーニングされた、高速で費用対効果の高いマルチモーダルAIモデルです。Gemini 3 Flashからの大幅なステップアップとして、このモデルは、本番運用規模のデプロイメント向けに、より強力な推論、高度なマルチモーダル機能、および改善された価格性能を提供します。Gemini 3.5 Flashは、複雑な動画分析、データ抽出、視覚的Q&Aなどのハイスループットのワークロード向けに最適化されています。Gemini 3.5 Flashの詳細をご覧ください

他の大規模言語モデルと同様に、Gemini 3.5 Flash の出力は一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 3 Flash

重要

Gemini 3 Flash の適用されるモデル規約を参照してください。

このモデルはグローバルエンドポイントでホストされており、クロスジオルーティングを有効にする必要があります。

モデルサービス名system.ai.gemini-3-flash

対応入力 :テキスト、画像、動画、音声

Gemini 3 Flashは、Googleが開発・トレーニングした、高速でコスト効率の高いマルチモーダルAIモデルです。このモデルは、品質を損なうことなく速度と規模を提供し、ニアリアルタイムでの複雑なビデオ分析、データ抽出、視覚的なQ&Aに対応する高度なマルチモーダル機能を備えています。Gemini 3 Flashは、優れた価格性能と高速性を提供し、本番運用規模のデプロイを可能にします。Gemini 3 Flashの詳細はこちら

他の大規模言語モデルと同様に、Gemini 3 Flashの出力は一部の事実を省略したり、誤った情報を生成したりする可能性があります。Databricksでは、精度が特に重要なシナリオでは、検索拡張生成(RAG)の使用を推奨します。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 3.1 Pro Preview

重要

Gemini 3.1 Pro Preview の 適用されるモデルの条件を参照してください。

このモデルはグローバルエンドポイントでホストされており、クロスジオルーティングを有効にする必要があります。

モデルサービス名system.ai.gemini-3-1-pro

対応入力 :テキスト、画像、動画、音声

Gemini 3.1 Pro Preview は、Google が開発およびトレーニングした、100 万トークンのコンテキスト ウィンドウを備えた最先端のハイブリッド推論モデルです。Gemini 3 Pro と比較して、Gemini 3.1 Pro はより強力な推論とドキュメント インテリジェンスを提供し、複雑なワークフローとタスクにおいて全体的にスマートなモデルとなっています。幅広い入力とタスクにおいて、複雑な推論、詳細な分析、マルチモーダルな理解に優れています

他の大規模言語モデルと同様に、Gemini 3.1 Pro Preview の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 3 Pro Preview

重要

Gemini 3 Pro Previewに適用されるモデル規約を参照してください。

このモデルはグローバルエンドポイントでホストされており、クロスジオルーティングを有効にする必要があります。

Google Gemini 3 Pro Preview は 2026年3月26日に廃止されます。推奨される代替モデルと、廃止期間中の移行方法に関するガイダンスについては、廃止されたモデルを参照してください。移行により多くの時間を確保するため、2026年3月26日~2026年6月7日の期間、Gemini 3 Pro への API 呼び出しは一時的に Gemini 3.1 Pro にリダイレクトされます。両方のモデルの価格は同じです。

モデルサービス名system.ai.gemini-3-pro

対応入力 :テキスト、画像、動画、音声

Gemini 3 Pro Preview は、Google によって開発およびトレーニングされた、100万トークンのコンテキストウィンドウを備えた最先端のハイブリッド推論モデルです。Gemini 3 Pro の高度な推論機能と組み込みのマルチモーダル機能により、幅広い入力とタスクにおいて、複雑な推論、詳細な分析、マルチモーダルな理解で優れた性能を発揮します。

他の大規模言語モデルと同様に、Gemini 3 Pro Preview の出力では一部の事実が省略される場合があり、場合によっては誤った情報が生成される可能性があります。Databricksでは、精度が特に重要なシナリオでは、検索拡張生成(RAG)の使用を推奨します。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 2.5 Pro

重要

Gemini 2.5 Pro については、適用されるモデルの条件を参照してください。

モデルサービス名system.ai.gemini-2-5-pro

対応入力 :テキスト、画像、動画、音声

Gemini 2.5 Proは、Googleが開発・トレーニングした、100万トークンのコンテキストウィンドウを備えたハイブリッド推論モデルです。Gemini 2.5 Proの「Deep Think Mode」と組み込みのオーディオ出力により、エンタープライズ、研究、クリエイティブなアプリケーション向けに、優れたモデルとして際立っています。複雑な推論、深い分析、幅広い種類の入力とタスクにおけるマルチモーダルな理解に優れるように設計されています。Gemini 2.5 Proについて詳しくはこちらをご覧ください。

他の大規模言語モデルと同様に、Gemini 2.5 Pro の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Google Gemini 2.5 Flash

重要

Gemini 2.5 Flash の場合は、適用されるモデル規約を参照してください。

モデルサービス名system.ai.gemini-2-5-flash

対応入力 :テキスト、画像、動画、音声

Gemini 2.5 Flashは、Googleによって開発およびトレーニングされた、高速で費用対効果の高いマルチモーダルAIモデルです。Google初の完全にハイブリッドな推論モデルであり、迅速でスケーラブルかつ手頃なAIソリューションを求める開発者や企業向けに設計されています。Gemini 2.5 Flashは、単一のコンテキストで最大100万トークンを処理でき、非常に大きなドキュメントやデータセットを扱うことができます。Gemini 2.5 Flashは、チャットボット、データ抽出、翻訳、ドキュメント解析などのリアルタイムおよび大容量アプリケーション向けに最適化されています。Gemini 2.5 Flashの詳細はこちらをご覧ください

他の大規模言語モデルと同様に、Gemini 2.5 Flash の出力は一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Alibaba クラウド Qwen3.5 122B A10B

備考

プレビュー

Qwen3.5 122B A10B モデルは パブリック プレビューです。

モデルサービス名system.ai.qwen35-122b-a10b

対応入力 : テキスト

Qwen3.5 122B A10B は、Alibaba クラウドによって構築およびトレーニングされたハイブリッドなMixture-of-Experts (MoE) 推論モデルであり、合計1220億のパラメーターと推論あたり100億のアクティブパラメーターを備えています。モデルは256Kのコンテキストウィンドウと最大8,000の出力トークンをサポートし、推論、コーディング、およびエージェントタスクにおいて高いパフォーマンスを発揮します。Qwen3.5 122B A10Bは推論のみのモデルであるため、常に応答する前に推論し、推論を無効にすることはできません。

他の大規模言語モデルと同様に、Qwen3.5 122B A10Bの出力は一部の事実を省略したり、場合によっては誤った情報を生成する可能性があります。Databricks では、精度が特に重要なシナリオで検索拡張生成 (RAG) を使用することをお勧めします。

Alibaba Cloud Qwen3-Embedding-0.6B

備考

プレビュー

Qwen3-Embedding-0.6B モデルは パブリックプレビュー です。

モデルサービス名system.ai.qwen3-embedding-0-6b

対応入力 : テキスト

Qwen3-Embedding-0.6Bは、約600Mのパラメーターを備えたコンパクトなテキスト埋め込みモデルであり、検索、類似性検索、クラスター化、分類などのセマンティックタスク向けに設計されています。表面的な形式ではなく意味を表す密なベクトルにテキストをエンコードします。

このモデルは100以上の言語(コードを含む)をサポートし、最大で約32,000トークンの長いコンテキストを処理できるため、長いドキュメントの埋め込みに適しています。構成可能な次元で最大1024のエンべディングを生成し、指示を認識してプロンプトを通じてタスク固有のバイアスを可能にします。

トランスフォーマーエンコーダーをベースとし、特に埋め込み生成のためにファインチューニングされたQwen3-Embedding-0.6Bは、埋め込み品質と効率的な推論のバランスを取っています。

埋め込みモデルは、検索拡張生成(RAG)のユースケースでLLMと組み合わせて使用すると特に効果的です。Qwen3-Embedding-0.6B は、LLM のコンテキストで使用できる、ドキュメントの大きなチャンク内の関連するテキストスニペットを見つけるために使用できます。

Alibaba Cloud Qwen3-Next 80B A3B Instruct

備考

プレビュー

Qwen3-Next 80B A3B Instruct モデルは パブリック プレビュー です。

モデルサービス名system.ai.qwen3-next-80b-a3b-instruct

対応入力 : テキスト

Qwen3-Next-80B-A3B-Instruct は、Alibaba Cloudによって構築およびトレーニングされた、命令に従うタスク用に最適化された非常に効率的な大規模言語モデルです。 このモデルは、非常に長いコンテキストを処理するように設計されており、マルチステップのワークフロー、RAG、高スループットで確定的な出力を必要とするエンタープライズ アプリケーションに最適です。

他の大規模言語モデルと同様に、Qwen3-Next 80B A3B Instructの出力は、一部の事実を省略したり、場合によっては誤った情報を生成したりする可能性があります。Databricksは、特に精度が重要となるシナリオにおいて、検索拡張生成(RAG)の使用を推奨しています。

OpenAI GPT OSS 120B

モデルサービス名system.ai.gpt-oss-120b

対応入力 : テキスト

GPT OSS 120Bは、OpenAIによって構築およびトレーニングされた、思考連鎖と調整可能な推論努力レベルを備えた最先端の推論モデルです。これはOpenAIのフラッグシップのオープンウェイトモデルであり、128K トークンのコンテキスト ウィンドウを備えています。このモデルは、高品質の推論タスク向けに構築されています。

他の大規模言語モデルと同様に、GPT OSS 120B の出力は一部の事実を省略したり、時には誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

OpenAI GPT OSS 20B

モデルサービス名system.ai.gpt-oss-20b

対応入力 : テキスト

GPT OSS 20B は、OpenAI によって構築およびトレーニングされた最先端の軽量推論モデルです。このモデルは128Kトークンのコンテキストウィンドウを備えており、リアルタイムのコパイロットおよびバッチ推論タスクに優れています。

他の大規模言語モデルと同様に、GPT OSS 20Bの出力は一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

Google Gemma 3 12B

重要

Gemma 3 の条件および利用規定ポリシーに関しては、適用されるモデルの条件を参照してください。

モデルサービス名system.ai.gemma-3-12b

対応入力 :テキスト、画像

Gemma 3 12B は、Gemma 3 ファミリーの一部として Google によって開発された、120億パラメーターのマルチモーダルおよびビジョン言語モデルです。Gemma 3 は最大 128K トークンのコンテキストを持ち、140 以上の言語を多言語でサポートしています。このモデルは、テキストと画像の両方の入力を処理し、テキスト出力を生成するように設計されており、対話のユースケース、テキスト生成、質問応答を含む画像理解タスクに最適化されています。

他の大規模言語モデルと同様に、Gemma 3の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

Meta Llama 4 Maverick

重要
  • Llama 4 コミュニティ ライセンスおよび利用規定ポリシーの適用に関しては、適用されるモデル条件を参照してください。
  • Meta Llama 4 Maverick は、トークン単位の従量課金では2026年3月9日に、プロビジョン済みスループットでは2026年6月9日に廃止されます。推奨される代替モデルと廃止期間中の移行方法に関するガイダンスについては、廃止されたモデルを参照してください。

モデルサービス名system.ai.llama-4-maverick

対応入力 :テキスト、画像

Llama 4 Maverick は、Meta によって構築およびトレーニングされた最先端の大規模言語モデルです。これは、 Llama モデルファミリーの中で初めて、コンピュートの効率のために専門家のアーキテクチャを組み合わせて使用しました。 Llama 4 Maverickは複数の言語をサポートし、画像とテキストを正確に理解するユースケースに最適化されています。Llama 4 Maverick の詳細をご覧ください。

他の大規模言語モデルと同様に、Llama 4の出力は一部の事実を省略し、場合によっては誤った情報を生成する可能性があります。Databricksでは、精度が特に重要なシナリオでは、検索拡張生成(RAG)の使用を推奨します。

Meta Llama 3.3 70B Instruct

モデルサービス名system.ai.meta-llama-3-3-70b-instruct

対応入力 : テキスト

Meta-Llama-3.3-70B-Instruct は、Meta によって構築およびトレーニングされた、128,000 トークンのコンテキストを持つ最先端の大規模言語モデルです。このモデルは複数の言語をサポートし、対話のユースケースに最適化されています。Meta Llama 3.3 の詳細はこちら

他の大規模言語モデルと同様に、Llama-3の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

Anthropic Claude Haiku 4.5

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-haiku-4-5

対応入力 :テキスト、画像

Claude Haiku 4.5は、Anthropicの最速かつ最も費用対効果の高いモデルであり、最先端に近いコーディング品質を優れた速度と効率性で提供しています。チャットアシスタント、顧客サービスエージェント、ペアプログラミング、ラピッドプロトタイピングなど、リアルタイムで低レイテンシーのアプリケーションに優れています。このモデルは、コストを重視する本番運用デプロイメントや、応答性の高いAIアシスタンスを必要とするエージェントシステムに最適です。

他の大規模言語モデルと同様に、Claude Haiku 4.5の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Sonnet 4.6

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-sonnet-4-6

対応入力 :テキスト、画像

Claude Sonnet 4.6は、Anthropicの最も高度なハイブリッド推論モデルです。タスクの複雑さに応じて、ほぼ瞬時の応答と、より深い推論を可能にする拡張思考の2つのモードを提供します。Claude Sonnet 4.6は、実用的なスループットと高度な思考のバランスを必要とするアプリケーション(顧客対応エージェント、本番運用のコーディングワークフロー、大規模なコンテンツ生成など)を専門としています。

他の大規模言語モデルと同様に、Claude Sonnet 4.6 の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Sonnet 4.5

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-sonnet-4-5

対応入力 :テキスト、画像

Claude Sonnet 4.5は、Anthropicの最も高度なハイブリッド推論モデルです。タスクの複雑さに応じて、ほぼ瞬時の応答と、より深い推論を可能にする拡張思考の2つのモードを提供します。Claude Sonnet 4.5は、顧客対応エージェント、本番運用コーディングワークフロー、大規模なコンテンツ生成など、実用的なスループットと高度な思考のバランスを必要とするアプリケーションに特化しています。

他の大規模言語モデルと同様に、Claude Sonnet 4.5 の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Fable 5

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

重要

Claude Fable 5の場合、プロンプトと応答は信頼性と安全性の目的のために30日間保持されます。このデータは自動化された安全システムによって処理され、特定の状況では人間のレビューのためにフラグが付けられる場合があります。データは30日後に自動的に削除されますが、安全調査や、データを30日を超えて保持する必要がある法的要件がある場合は除きます。Anthropicは、この安全保持の目的のための限定的なサブプロセッサーです。

警告

このデータ保持期間と互換性のないワークスペースは、モデルサービスを確認できますが、呼び出すことはできません。

モデルサービス名system.ai.claude-fable-5

対応入力 : テキスト

Claude Fable 5は、Anthropicが提供するMythosクラスのモデルで、自律的な知識作業とコーディングのために設計されています。堅牢なセーフガードが組み込まれており、従来のモデルよりも人による確認の必要性が低く、長時間実行される複雑な非同期タスクを処理できるため、広範なコンテキストにわたって継続的な集中が必要なエージェントワークフローに適しています。

他の大規模言語モデルと同様に、Claude Fable 5の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Opus 4.8

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-opus-4-8

対応入力 :テキスト、画像

Claude Opus 4.8 は、Anthropic の最も高性能なハイブリッド推論モデルであり、Opus シリーズを基盤として、精度、効率、推論機能がさらに向上しています。このモデルは、画像サポートを備えた複雑な抽出およびエージェント推論タスクに優れており、詳細な分析、ドキュメントの理解、高度な多段階ワークフローを必要とするエンタープライズ アプリケーションに最適です。

他の大規模言語モデルと同様に、Claude Opus 4.8 の出力では一部の事実が省略されたり、場合によっては誤った情報が生成されることがあります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Opus 4.7

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-opus-4-7

対応入力 :テキスト、画像

Claude Opus 4.7 は Anthropic の最も高性能なハイブリッド推論モデルであり、精度、効率性、および強化された視覚機能の向上により、Opus シリーズをさらに進化させています。このモデルは、複雑な抽出タスクとエージェント的な推論タスクにおいて、前身モデルよりも少ない出力トークンを使用しながら、より強力なパフォーマンスを発揮します。Claude Opus 4.7 は、100万トークンのコンテキストウィンドウと強化された画像解像度サポートを備えており、詳細な分析、ドキュメントの理解、および高度な多段階ワークフローを必要とするエンタープライズアプリケーションに最適です。

他の大規模言語モデルと同様に、Claude Opus 4.7の出力では一部の事実が省略され、場合によっては誤った情報が生成される場合があります。Databricksでは、精度が特に重要なシナリオでは、Retrieval Augmented Generation (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Opus 4.6

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-opus-4-6

対応入力 :テキスト、画像

Claude Opus 4.6は、適応思考機能を備えたAnthropicの最も高性能なハイブリッド推論モデルです。このモデルは、最も要求の厳しいタスク向けに新しい最大エフォートレベルを導入しており、最適なパフォーマンスのために高いエフォートがデフォルトとして設定されています。Claude Opus 4.6は、複雑な推論、詳細な分析、コード生成、研究、高度な多段階ワークフローに優れています。100万トークンのコンテキストウィンドウを搭載しており、広範な分析と包括的な出力の両方を必要とするエンタープライズアプリケーションに最適です。

他の大規模言語モデルと同様に、Claude Opus 4.6 の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Opus 4.5

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-opus-4-5

対応入力 :テキスト、画像

Claude Opus 4.5 は、Anthropic の最も高性能なハイブリッド推論モデルであり、深い分析と広範な思考を必要とする最も複雑なタスク向けに構築されています。このモデルは、強力な汎用機能と高度な推論を組み合わせ、コード生成、研究、コンテンツ作成、高度な多段階エージェントワークフローに優れています。Claude Opus 4.5 は、200K トークンのコンテキストウィンドウを備えたテキストおよび視覚入力をサポートしており、幅広い理解と深い理解の両方が求められるエンタープライズアプリケーションに最適です。

他の大規模言語モデルと同様に、Claude Opus 4.5 の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Sonnet 4

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-sonnet-4

対応入力 :テキスト、画像

Claude Sonnet 4は、Anthropicによって構築およびトレーニングされた最先端のハイブリッド推論モデルです。このモデルには、2つのモードがあります。ほぼ瞬時の応答と、タスクの複雑さに基づいたより深い推論のための拡張思考です。Claude Sonnet 4は、コード開発、大規模コンテンツ分析、エージェントアプリケーション開発など、さまざまなタスクに最適化されています。

他の大規模言語モデルと同様に、Claude Sonnet 4 の出力では一部の事実が省略され、場合によっては誤った情報が生成される可能性があります。Databricks では、精度が特に重要なシナリオでは、検索拡張生成(RAG)を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

Anthropic Claude Opus 4.1

重要

顧客は、Anthropic の利用ポリシーの条項に対するコンプライアンスを確保する責任があります。

モデルサービス名system.ai.claude-opus-4-1

対応入力 :テキスト、画像

Claude Opus 4.1は、Anthropicによって構築およびトレーニングされた最先端のハイブリッド推論モデルです。この汎用大規模言語モデルは、複雑な推論とエンタープライズ規模での実世界のアプリケーションの両方のために設計されています。テキストと画像入力をサポートし、200K トークンのコンテキスト ウィンドウと 32K の出力トークン機能を提供します。このモデルは、コード生成、リサーチとコンテンツ作成、継続的な人間の介入なしのマルチステップ エージェント ワークフローなどのタスクに優れています。

他の大規模言語モデルと同様に、Claude Opus 4.1の出力は、一部の事実を省略したり、誤った情報を生成したりする場合があります。Databricks では、精度が特に重要なシナリオで検索拡張生成 (RAG) を使用することをお勧めします。

このモデルサービスは、Databricksセキュリティ境界内でDatabricksによってホストされています。

GTE Large (En)

モデルサービス名system.ai.gte-large-en

対応入力 : テキスト

General Text Embedding(GTE) は、任意のテキストを1024次元の埋め込みベクトルと8192トークンの埋め込みウィンドウにマップできるテキスト埋め込みモデルです。これらのベクトルは、LLM のベクトル インデックスや、検索、分類、質問応答、クラスター、セマンティック検索などのタスクに使用できます。このモデルサービスはモデルの英語版を提供し、正規化された埋め込みは生成しません。

埋め込みモデルは、検索拡張生成(RAG)のユースケースでLLMと組み合わせて使用すると特に効果的です。GTEは、LLMのコンテキストで使用できる、大量のドキュメントのチャンク内の関連するテキストスニペットを見つけるために使用できます。

その他のリソース