メインコンテンツまでスキップ

Mosaic AI Model Serving でサポートされている基盤モデル

この記事では、Mosaic AI Model Servingを使用して提供できる基盤モデルについて説明します。

基盤モデルは、大規模な事前トレーニング済みのニューラルネットワークであり、大規模なデータと広範なデータの両方でトレーニングされています。 これらのモデルは、言語、画像、またはその他のデータ型の一般的なパターンを学習するように設計されており、追加のトレーニングを使用して特定のタスクに合わせて微調整できます。お客様による特定の基盤モデルの使用には、モデル開発者のライセンスおよび利用規定が適用されます。 「適用可能なモデル開発者のライセンスと条件」を参照してください。

モデルサービングは、お客様のニーズに基づいて基盤モデルをホスティングおよびクエリするための柔軟なオプションを提供します。

  • AI Functions に最適化されたモデル: Databricks でホストされているモデルのサブセットは、AI Functions 用に最適化されています。データに AI を適用し、これらの関数とサポートされているモデルを使用して、バッチ推論 本番運用ワークロードを大規模に実行できます。
  • トークン単位の従量課金: 実験や迅速な探索に最適です。 このオプションを使用すると、事前のインフラストラクチャ コミットメントなしで、Databricks ワークスペース内の事前構成済みエンドポイントに対してクエリを実行できます。
  • プロビジョニング スループット: パフォーマンスの保証が必要な本番運用のユースケースに推奨されます。 このオプションを使用すると、最適化されたサービスエンドポイントを使用して、微調整された基盤モデルをデプロイできます。
  • 外部モデル: このオプションを使用すると、OpenAI や Anthropic によって提供されるモデルなど、Databricks の外部でホストされている基盤モデルにアクセスできます。 これらのモデルは、Databricks 内で一元管理して、ガバナンスを効率化できます。

Databricks でホストされる基盤モデル

Databricks は、Meta Llamaのような最先端のオープン基盤モデルをホストしています。 これらのモデルは、基盤モデル APIを使用して使用できます。

次の表は、モデルサービング機能に基づいて、各リージョンでサポートされている Databricksホスト型モデルとモデルファミリをまとめたものです。

important
  • MetaLlama 4 Maverick は、APIsパブリック プレビュー の基盤モデル プロビジョニング スループット ワークロードで使用できます。

  • 2024 年 12 月 11 日以降、Meta-Llama-3.3-70B-Instruct は、トークン単位の従量課金エンドポイントの基盤モデル API Meta-Llama-3.1-70B-Instruct のサポートを置き換えます。

  • 以下のモデルは現在廃止されています。 推奨される交換モデルについては 、廃止されたモデル を参照してください。

    • Mixtral-8x7B Instruct
    • DBRX
    • Llama 2 70B Chat
    • MPT 7B Instruct
    • MPT 30B Instruct

リージョン

AI関数最適化モデル

トークン従量課金の基盤モデルAPI

プロビジョン済みスループット基盤モデルAPI

ap-northeast-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

ap-northeast-2

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

ap-south-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1*
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

ap-southeast-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

ap-southeast-2

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

ca-central-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

eu-central-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

eu-west-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

eu-west-2

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

eu-west-3

サポートされていない

サポートされていない

サポートされていない

sa-east-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B *
  • Meta Llama 4 Maverick* (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

us-east-1

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

us-east-2

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

us-gov-west-1

サポートされていない

サポートされていない

サポートされていない

us-west-1

サポートされていない

サポートされていない

サポートされていない

us-west-2

次のモデルがサポートされています。

次のモデルがサポートされています。

次のモデルファミリがサポートされています。

  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (プレビュー)
  • Meta Llama 3.3
  • Meta Llama 3.2 3B
  • Meta Llama 3.2 1B
  • Meta Llama 3.1
  • GTE v1.5 (英語)
  • BGE v1.5 (英語)
  • DeepSeek R1 ( Unity Catalogでは利用できません)

サポートされているレガシーモデルファミリ:

  • Meta Llama 3
  • Meta Llama 2
  • DBRX
  • Mistral
  • Mixtral
  • MPT

* このモデルは GPU の可用性に基づいてサポートされ、 地域間ルーティングを有効にする必要があります

Databricks の外部でホストされている基盤モデルにアクセスする

OpenAI や Anthropic などの LLM プロバイダーによって作成された基盤モデルには、 Databricks で外部モデルを使用してアクセスすることもできます。 これらのモデルは Databricks の外部でホストされており、クエリを実行するためのエンドポイントを作成できます。 これらのエンドポイントは Databricks から一元的に管理できるため、組織内のさまざまな LLM プロバイダーの使用と管理が効率化されます。

次の表に、サポートされているモデルと対応する エンドポイントの種類の一覧を示します。 一覧表示されているモデルの関連付けを使用すると、新しくリリースされたモデルの種類が特定のプロバイダーで利用可能になったときに、エンドポイントとして構成できます。 お客様は、該当するモデルライセンスでコンプライアンスを確保する責任があります。

注記

LLMの急速な発展に伴い、このリストが常に最新であるという保証はありません。 同じプロバイダーの新しいモデル バージョンは、通常、リストにない場合でもサポートされます。

モデルプロバイダー

llm/v1/completions

llm/v1/chat

llm/v1/embeddings

OpenAI**

  • gpt-3.5-turbo-instruct - babbage-002 - davinci-002
  • o1 - o1-mini - o1-mini-2024-09-12 - gpt-3.5-turbo - gpt-4 - gpt-4-turbo - gpt-4-turbo-2024-04 - gpt-4o - gpt-4o-2024-05-13 - gpt-4o-mini
  • text-embedding-ada-002 - text-embedding-3-large - text-embedding-3-small

Azure OpenAI**

  • text-davinci-003 - gpt-35-turbo-instruct
  • o1 - o1-mini - gpt-35-turbo - gpt-35-turbo-16k - gpt-4 - gpt-4-turbo - gpt-4-32k - gpt-4o - gpt-4o-mini
  • text-embedding-ada-002 - text-embedding-3-large - text-embedding-3-small

Anthropic

  • claude-1 - claude-1.3-100k - claude-2 - claude-2.1 - claude-2.0 - claude-instant-1.2
  • claude-3-5-sonnet-latest - claude-3-5-haiku-latest - claude-3-5-opus-latest - claude-3-5-sonnet-20241022 - claude-3-5-haiku-20241022 - claude-3-5-sonnet-20240620 - claude-3-haiku-20240307 - claude-3-opus-20240229 - claude-3-sonnet-20240229

Cohere**

  • command - command-light
  • command-r7b-12-2024 - command-r-plus-08-2024 - command-r-08-2024 - command-r-plus - command-r - command - command-light-nightly - command-light - command-nightly
  • embed-english-v2.0 - embed-multilingual-v2.0 (英語) - embed-english-light-v2.0 - embed-english-v3.0 - embed-english-light-v3.0 - embed-multilingual-v3.0 - embed-multilingual-light-v3.0 (英語)

Mosaic AI モデルサービング

Databricks サービス エンドポイント

Databricks サービス エンドポイント

Databricks サービス エンドポイント

Amazon Bedrock

Anthropic: - claude-instant-v1 - claude-v2 Cohere: - command-text-v14 - コマンドライトテキストV14 AI21 Labs: - j2-grande-instruct - j2-jumbo-instruct - j2-mid - j2-mid-v1 - j2-ultra - j2-ultra-v1

Anthropic: - claude-3-5-sonnet-20241022-v2:0 - claude-3-5-haiku-20241022-v1:0 - claude-3-opus-20240229-v1:0 - claude-3-sonnet-20240229-v1:0 - claude-3-5-sonnet-20240620-v1:0 Cohere: - command-r-plus-v1:0 - command-r-v1:0 Amazon: - nova-lite-v1:0 - nova-micro-v1:0 - nova-pro-v1:0

Amazon: - titan-embed-text-v2:0 - titan-embed-text-v1 - titan-embed-g1-text-02 Cohere: - embed-english-v3 - embed-multilingual-v3

AI21 Labs

  • j2-mid - j2-light - j2-ultra

Google Cloud Vertex AI

text-bison

  • chat-bison - gemini-pro - gemini-1.0-pro - gemini-1.5-pro - gemini-1.5-flash - gemini-2.0-flash
  • text-embedding-004 - text-embedding-005 - textembedding-gecko

** モデル プロバイダーは、ファインチューニングされた補完モデルとチャット モデルをサポートしています。 ファインチューニングされたモデルをクエリするには、external model構成の name フィールドにファインチューニングされたモデルの名前を入力します。

モデル プロバイダーは、カスタム完了モデルをサポートしています。

エンドポイントを提供する基盤モデルの作成

AIアプリケーションで基盤モデルをクエリして使用するには、まずモデルサービング エンドポイントを作成する必要があります。モデルサービングは、統合された API とUIを使用して、基盤モデルを提供するエンドポイントを作成および更新します。

クエリ基盤モデルの提供エンドポイント

サービングエンドポイントを作成したら、基盤モデルをクエリできます。 モデルサービングは、基盤モデルのクエリに統一されたOpenAI互換の API と SDK を使用します。 この統一されたエクスペリエンスにより、エクスペリメントを行い、サポートされているクラウドやプロバイダー間での本番運用のための基盤モデルをカスタマイズする方法が簡素化されます。

基盤モデルの使用を参照してください。