生成AIモデルのメンテナンスポリシー

この記事では、基盤モデルAPIおよびMosaic AIモデル オファリングのモデル メンテナンス ポリシーについて説明します。

最先端のモデルを引き続きサポートするために、 Databricks は、サポートされているモデルを更新するか、基盤モデル APIs トークン単位の従量課金と Mosaic AI Model トレーニング オファリングの古いモデルを廃止する場合があります。

モデル廃止ポリシー

次の廃止ポリシーは、基盤モデル APIs トークン単位の従量課金と Mosaic AI Model トレーニング オファリングでサポートされているチャット モデルと完了モデルにのみ適用されます。

モデルが廃止対象に設定されている場合、 Databricks次の手順を実行して顧客に通知します。

  • Databricks ワークスペースの[サービス]ページのモデル カードに、モデルの廃止が予定されていることを示す警告メッセージが表示されます。

  • 実験タブのMosaic AIモデル トレーニング」の「廃止」メニューに、モデルが廃止される予定であることを示す警告メッセージが表示されます。

  • 該当するドキュメントには、モデルが廃止予定であることと、モデルのサポートが終了する開始日を示す通知が含まれています。

お客様に今後のモデルの廃止について通知した後、 Databricksは3 か月以内にモデルを廃止します。 この期間中、顧客は、サポート終了日を過ぎてもモデルを引き続き使用するために、 オフライン エンドポイントに移行することを選択できます。

現在廃止されているモデルと計画されている廃止日の一覧については、 廃止されたモデル を参照してください。

モデルの更新

Databricks 、最適化を実現するために、トークン単位の従量課金モデルに増分更新を出荷する場合があります。 モデルが更新されても、エンドポイント URL は変わりませんが、レスポンス オブジェクトのモデル ID は更新日を反映して変更されます。 たとえば、更新プログラムが 2024 年 3 月 4 日に meta-llama/Meta-Llama-3.1-405B に出荷された場合、応答オブジェクトのモデル名は meta-llama/Meta-Llama-3.1-405B-030424に更新されます。 Databricks は、参照できる更新プログラムのバージョン履歴を保持します。

リタイアモデル

次のセクションでは、基盤モデル APIs トークン単位の従量課金と Mosaic AI Model トレーニング オファリングの現在および今後のモデルの廃止をまとめます。

Mosaic AI モデル トレーニングの廃止

次の表は、廃止されたモデル ファミリ、その廃止日、および Mosaic AI モデル トレーニング ワークロードに使用する推奨される代替モデル ファミリを示しています。 Databricks では、指定された廃止日より前に、代替モデルを使用するようにアプリケーションを移行することをお勧めします。

モデルファミリー

廃止日

推奨される代替モデルファミリー

Meta-Llama-3

2024年12月13日

Meta-Llama-3.1

メタ・ラマ-2

2024年12月13日

Meta-Llama-3.1

コード Llama

2024年12月13日

Meta-Llama-3.1

基盤モデル APIs トークン単位の従量課金 retirements

次の表は、モデルの廃止、その廃止日、および基盤モデルAPIのトークン単位の従量課金ワークロードに使用する推奨代替モデルを示しています。 Databricks では、指定された廃止日より前に、アプリケーションを移行して代替モデルを使用することをお勧めします。

重要

2024年7月23日、Meta-Llama-3.1-70B-Instruct Meta-Llama-3-70B-Instruct のサポートを、トークン単位の従量課金エンドポイントの基盤モデル APIs 置き換えました。

モデル

廃止日

推奨される交換モデル

Meta-Llama-3-70B-Instruct

2024年7月23日

Meta-Llama-3.1-70B-Instruct

Meta-Llama-2-70B-Chat

2024年10月30日

Meta-Llama-3.1-70B-Instruct

MPT 7B Instruct

2024年8月30日

Mixtral -8x7B

MPT 30B Instruct

2024年8月30日

Mixtral -8x7B

特定のモデル バージョンの長期サポートが必要な場合、Databricksではサービングワークロードで基盤モデルAPIのプロビジョン済みスループットを使用することをお勧めします。