生成AIモデルのメンテナンスポリシー
この記事では、 基盤モデル APIs トークン単位の従量課金 オファリングと 基盤モデル ファインチューニング オファリングのモデル メンテナンス ポリシーについて説明します。
最先端のモデルを引き続きサポートするために、 Databricks は、サポートされているモデルを更新するか、基盤モデル APIs トークン単位の従量課金および基盤モデル ファインチューニング オファリングの古いモデルを廃止する場合があります。
モデル廃止ポリシー
次の廃止ポリシーは、基盤モデル APIs トークン単位の従量課金 と 基盤モデル ファインチューニング オファリングでサポートされているチャット モデルと完了モデルにのみ適用されます。
モデルが廃止されると、そのモデルは使用できなくなり、指定された機能オファリングから削除されます。 Databricks 、廃止が予定されているモデルについて顧客に通知するために、次の手順を実行します。
Databricks ワークスペースの[サービス]ページのモデル カードに、モデルの廃止が予定されていることを示す警告メッセージが表示されます。
エクスペリメント タブの [ドロップダウン メニュー] の [基盤モデル ファインチューニング] に、モデルが廃止予定であることを示す警告メッセージが表示されます。
該当するドキュメントには、モデルが廃止予定であることと、サポートされなくなる開始日を示す通知が含まれています。
今後のモデルの廃止についてユーザーに通知された後、Databricks は 3 か月後にモデルを廃止します。 この 3 か月間、お客様は次のいずれかを行うことができます。
プロビジョニングされたスループットエンドポイントに移行して、サポート終了日を過ぎてもモデルを引き続き使用することを選択します
既存のワークフローを移行して、推奨される代替モデルを使用します。
廃止日になると、モデルは製品から削除され、該当するドキュメントが更新されて、交換モデルの使用が推奨されます。
現在廃止されているモデルと計画されている廃止日の一覧については、 廃止されたモデル を参照してください。
モデルの更新
Databricks 、最適化を実現するために、トークン単位の従量課金モデルに増分更新を出荷する場合があります。 モデルが更新されても、エンドポイント URL は変わりませんが、レスポンス オブジェクトのモデル ID は更新日を反映して変更されます。 たとえば、更新プログラムが 2024 年 3 月 4 日に meta-llama/Meta-Llama-3.1-405B
に出荷された場合、応答オブジェクトのモデル名は meta-llama/Meta-Llama-3.1-405B-030424
に更新されます。 Databricks は、参照できる更新プログラムのバージョン履歴を保持します。
リタイアモデル
次のセクションでは、基盤モデル APIs トークン単位の従量課金 と 基盤モデル ファインチューニング オファリングの現在および今後のモデルの廃止についてまとめます。
基盤モデル ファインチューニング retirements
次の表は、廃止されたモデル ファミリ、その廃止日、および基盤モデル ファインチューニング ワークロードに使用する推奨される代替モデル ファミリを示しています。 Databricks では、指定された廃止日より前に、代替モデルを使用するようにアプリケーションを移行することをお勧めします。
モデルファミリー |
廃止日 |
推奨される代替モデルファミリー |
---|---|---|
Meta-Llama-3 |
2025年1月7日 |
Meta-Llama-3.1 |
メタ・ラマ-2 |
2025年1月7日 |
Meta-Llama-3.1 |
コード Llama |
2025年1月7日 |
Meta-Llama-3.1 |
基盤モデル APIs トークン単位の従量課金 retirements
次の表は、モデルの廃止、その廃止日、および基盤モデルAPIのトークン単位の従量課金ワークロードに使用する推奨代替モデルを示しています。 Databricks では、指定された廃止日より前に、アプリケーションを移行して代替モデルを使用することをお勧めします。
重要
2024年12月11日、Meta-Llama-3.3-70B-Instruct Meta-Llama-3.1-70B-Instruct のサポートを、トークン単位の従量課金エンドポイント APIs 置き換えました。
モデル |
廃止日 |
推奨される交換モデル |
---|---|---|
Meta-Llama-3.1-70B-Instruct |
2024年12月11日 |
メタラマ-3.3-70B-指示 |
Meta-Llama-3-70B-Instruct |
2024年7月23日 |
Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat |
2024年10月30日 |
Meta-Llama-3.1-70B-Instruct |
MPT 7B Instruct |
2024年8月30日 |
Mixtral -8x7B |
MPT 30B Instruct |
2024年8月30日 |
Mixtral -8x7B |
特定のモデル バージョンの長期サポートが必要な場合、Databricksではサービングワークロードで基盤モデルAPIのプロビジョン済みスループットを使用することをお勧めします。