メインコンテンツまでスキップ

基盤モデルを使用する

この記事では、基盤モデルのクエリ要求を記述するために使用できるオプションと、それらをモデルサービングエンドポイントに送信する方法について説明します。 Databricks によってホストされている基盤モデルと、Databricks の外部でホストされている基盤モデルに対してクエリを実行できます。

従来の ML モデルまたは Python モデルのクエリ要求については、 カスタム モデルのクエリ サービング エンドポイントを参照してください。

モデルサービング、基盤モデルAPIsと基盤モデルにアクセスするための外部モデルをサポートします。 モデルサービングは、OpenAI互換の統一されたAPIとSDKを使用して、モデルへのクエリを実行します。これにより、サポートされているクラウドとプロバイダー全体での本番運用に向けて、プラットフォーム モデルを体験し、カスタマイズすることが可能になります。

クエリオプション

モデルサービングでは、基盤モデルを提供するエンドポイントにクエリリクエストを送信するための以下のオプションが提供されます。

メソッド

詳細

OpenAIクライアント

OpenAIクライアントを使用して、モデルサービングエンドポイントによってホストされているモデルにクエリを実行します。モデルサービング エンドポイント名をmodel入力として指定します。 外部モデルによって提供されるチャット、埋め込み、および補完モデルに対応しています。

サービングUI

サービングエンドポイント ページから エンドポイントのクエリー を選択します。JSON形式のモデル入力データを挿入し、 リクエストを送信 をクリックします。 モデルに入力例がログに記録されている場合は、 例を表示 を使用して読み込みます。

REST API

REST API を使用してモデルを呼び出し、クエリを実行します。 詳細は POST /serving-endpoints/{name}/invocations を参照してください。 複数のモデルを提供するエンドポイントへの要求のスコアリングについては、エンドポイントの背後にある個々のモデルのクエリを参照してください。

MLflow Deployments SDK

MLflow Deployments SDK の predict() 関数を使用して、モデルに対してクエリを実行します。

Databricks Python SDK

Databricks Python SDK は、REST API の上位にあるレイヤーです。 認証などの低レベルの詳細を処理するため、モデルとの対話が容易になります。

必要条件

パッケージのインストール

クエリ方法を選択したら、まず適切なパッケージをクラスターにインストールする必要があります。

OpenAI クライアントを使用するには、 databricks-openaiパッケージをクラスターにインストールする必要があります。このパッケージは、生成AIモデルを照会するように自動的に構成された認証をOpenAIクライアントに提供します。 ノートブックまたはローカル ターミナルで次のコマンドを実行します。

pip install -U databricks-openai

以下は、パッケージを Databricks ノートブックにインストールする場合にのみ必要です

Python
dbutils.library.restartPython()

基盤モデル types

次の表は、タスクタイプに基づいてサポートされている基盤モデルをまとめたものです。

タスクのタイプ

説明

サポートされているモデル

いつ使うの?推奨される使用例

汎用

自然なマルチターンの会話を理解し、参加するように設計されたモデル。彼らは人間の対話の大規模なデータセットで微調整されているため、文脈的に関連性のある応答を生成し、会話の履歴を追跡し、さまざまなトピックにわたって一貫した人間のような対話を提供することができます。

Databricks でホストされる基盤モデルは次のとおりです。

サポートされている外部モデルは次のとおりです。

  • OpenAI GPTおよびoシリーズモデル
  • Anthropic クロードモデル
  • Google Geminiモデル

自然なマルチターンの対話と文脈の理解が必要なシナリオに推奨されます。

  • バーチャルアシスタント
  • 顧客サポート ボット
  • インタラクティブな個別指導システム。

Embeddings

エンベッディングモデルは、テキスト、画像、オーディオなどの複雑なデータをエンベディングと呼ばれるコンパクトな数値ベクトルに変換する機械学習システムです。これらのベクトルは、データ内の重要な特徴と関係をキャプチャするため、効率的な比較、クラスタリング、およびセマンティック検索が可能になります。

Databricks でホストされる基盤モデルは次のとおりです。

サポートされている外部モデルは次のとおりです。

  • OpenAIテキストエンべディングモデル
  • Cohere テキストエンべディングモデル
  • Google テキストエンべディングモデル

セマンティックな理解、類似性の比較、複雑なデータの効率的な取得またはクラスタリングが不可欠なアプリケーションに推奨されます。

  • セマンティック検索
  • 検索拡張生成(RAG)
  • トピックのクラスタリング
  • 感情分析とテキストアナリティクス

ビジョン

画像やビデオなどの視覚データを処理、解釈、分析するように設計されたモデルにより、機械は視覚世界を「見て」理解できます。

Databricks でホストされる基盤モデルは次のとおりです。

サポートされている外部モデルは次のとおりです。

  • ビジョン機能を備えたOpenAIGPTおよびoシリーズモデル
  • ビジョン機能を備えたAnthropic Claudeモデル
  • ビジョン機能を備えたGoogle Geminiモデル
  • OpenAI APIと互換性のあるビジョン機能を備えた他の外部基盤モデルもサポートされています。

視覚情報の自動化、正確性、拡張性の向上が必要な場合に推奨されます。

  • 物体の検出と認識
  • 画像分類
  • 画像のセグメンテーション
  • ドキュメントの理解

推論

人間のような論理的思考をシミュレートするように設計された高度なAIシステム。推論モデルは、シンボリックロジック、確率的推論、ニューラルネットワークなどの手法を統合して、コンテキストを分析し、タスクを分解し、その意思決定を説明します。

Databricks でホストされる基盤モデルは次のとおりです。

サポートされている外部モデルは次のとおりです。

  • 推論機能を備えたOpenAIモデル
  • Anthropic クロードは推論能力を持つモデルです
  • 推論機能を備えたGoogle Geminiモデル

視覚情報の自動化、正確性、拡張性の向上が必要な場合に推奨されます。

  • コードの生成
  • コンテンツの作成と要約
  • エージェントのオーケストレーション

関数呼び出し

Databricks Function Calling は OpenAI と互換性があり、 基盤モデル API の一部としてモデルサービング中のみ使用でき、 外部モデルを提供するサービング エンドポイントを利用できます。 詳細については、「 Databricks での関数呼び出し」を参照してください。

構造化された出力

Structured outputs は OpenAI と互換性があり、基盤モデル APIの一部としてモデルサービング中のみ使用できます。詳細については、「 Databricks での構造化出力」を参照してください。

プロンプトキャッシュ

プロンプト キャッシュは、 Databricksでホストされる Claude モデルに対して、インフラストラクチャ モデルAPIsの一部としてサポートされています。

クエリ リクエストでcache_control引数を指定して、次のものをキャッシュできます。

  • messages.content配列内のテキスト コンテンツ メッセージ。
  • messages.content配列内のメッセージ コンテンツを検討しています。
  • messages.content配列内の画像コンテンツ ブロック。
  • ツールの使用、結果、および定義はtools配列内にあります。

「 プラットフォームモデルREST APIリファレンス 」を参照してください。

JSON
{
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What's the date today?",
"cache_control": { "type": "ephemeral" }
}
]
}
]
}
注記

Databricks REST API は OpenAI と互換性があり、Anthropic API とは異なります。これらの違いは、次のような応答オブジェクトにも影響します。

  • 出力はchoicesフィールドに返されます。
  • ストリーミング チャンク形式。すべてのチャンクは同じ形式に準拠しており、 choicesには応答deltaが含まれ、使用状況はチャンクごとに返されます。
  • 停止理由はfinish_reasonフィールドに返されます。
    • Anthropic は、 end_turnstop_sequencemax_tokens 、および tool_use
    • それぞれ、Databricksはstopstoplength 、および tool_calls

AI Playground を使用してサポートされている LLM とチャットする

サポートされている大規模言語モデルは、 AI Playgroundを使用して操作できます。 AI Playground は、Databricks ワークスペースから LLM をテスト、プロンプト、比較できるチャットのような環境です。

AI playground

追加のリソース