基盤APIsモデル保守ポリシー

この記事では、トークン単位の従量課金の基盤モデルAPIsオファリングのモデル保守ポリシーについて説明します。

基盤モデルAPIトークン単位の従量課金オファリングにより、顧客は最適なモデルを拡張できます。 最先端のモデルを引き続きサポートするために、Databricks は古いモデルを廃止したり、サポートされているモデルを更新したりする可能性があります。

特定のモデル バージョンの長期サポートが必要な場合、Databricks ではプロビジョニングされたスループットを使用することをお勧めします。

モデルの廃止

以下の廃止ポリシーは、チャット モデルと完了モデルにのみ適用されます。

モデルが廃止対象に設定されている場合、 Databricks次の手順を実行して顧客に通知します。

  • Databricks ワークスペースの[サービス]ページのモデル カードに、モデルの廃止が予定されていることを示す警告メッセージが表示されます。

  • ドキュメントには、モデルが廃止される予定であることと、モデルがサポートされなくなる開始日を示す通知が含まれています。

お客様に今後のモデルの廃止について通知した後、 Databricks 3 か月以内にモデルを廃止します。 この期間中、顧客は、サポート終了日を過ぎてもモデルを引き続き使用するために、 オフライン エンドポイントに移行することを選択できます。

モデルの更新

Databricks は、最適化を実現するために、トークンごとの支払いモデルに増分更新を配布する場合があります。 モデルが更新されると、エンドポイント URL は変わりませんが、応答オブジェクトのモデル ID は更新の日付を反映するように変更されます。 たとえば、更新プログラムが 2024 年 3 月 4 日に llama-2-70b-chat に出荷された場合、応答オブジェクトのモデル名はそれに応じて llama-2-70b-chat-030424に更新されます。 Databricks は、顧客が参照できる更新のバージョン履歴を維持します。