Generative AI modela a política de manutenção
Este artigo descreve a política de manutenção do modelo para o Foundation Model APIs pay-per-tokens e as ofertas do Foundation Model Fine-tuning.
Para continuar a oferecer suporte aos modelos mais modernos, o site Databricks pode atualizar os modelos suportados ou retirar os modelos mais antigos das ofertas de pagamento por token e de ajuste fino do Foundation Model APIs.
Política de aposentadoria modelo
A política de aposentadoria a seguir se aplica somente aos modelos de bate-papo e de conclusão suportados nas ofertas de pagamento por token do Foundation Model APIs e do Foundation Model Fine-tuning.
Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recurso indicadas. A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
- Uma mensagem de aviso é exibida no cartão do modelo na página Serving do site Databricks workspace , indicando que o modelo está planejado para ser desativado.
- Uma mensagem de aviso é exibida no menu dropdown para Foundation Model Fine-tuning no site Experiments tab, indicando que o modelo está planejado para ser desativado.
- A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que não haverá mais suporte.
Depois que os usuários forem notificados sobre a próxima retirada do modelo, a Databricks retirará o modelo em três meses. Durante esse período de três meses, os clientes podem:
- Opte por migrar para um provisionamento Taxa de transferência endpoint para continuar usando o modelo após a data de fim de vida útil.
- Migrar o fluxo de trabalho existente para usar os modelos de substituição recomendados.
Na data de aposentadoria, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo substituto.
Consulte Modelos aposentados para obter uma lista dos modelos atualmente aposentados e das datas planejadas de aposentadoria.
Atualizações do modelo
Databricks pode enviar atualizações incrementais para modelos de pagamento por tokens para fornecer otimizações. Quando um modelo é atualizado, o URL do endpoint permanece o mesmo, mas o ID do modelo no objeto de resposta é alterado para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B
em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424
. Databricks mantém um histórico de versões das atualizações que o senhor pode consultar.
Modelos aposentados
As seções a seguir resumem as aposentadorias de modelos atuais e futuras para as ofertas de pay-per-tokens do Foundation Model APIs e do Foundation Model Fine-tuning.
Foundation Model Ajustando as aposentadorias
A tabela a seguir mostra as famílias de modelos aposentados, suas datas de aposentadoria e as famílias de modelos de substituição recomendadas para usar nas cargas de trabalho de ajuste fino do Foundation Model. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Família de modelos | Data de aposentadoria | Família de modelos de substituição recomendada |
---|---|---|
DBRX | 30 de abril de 2025 | Lhama-3.1-70B |
Mixtral | 30 de abril de 2025 | Lhama-3.1-70B |
Mistral | 30 de abril de 2025 | Lhama-3.1-8B |
Meta-Llama-3.1-405B | 30 de janeiro de 2025 | Lhama-3.1-70B |
Meta-Lama-3 | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Meta-Lama-2 | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Código Llama | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Modelo da Fundação APIs aposentadorias pay-per-tokens
A tabela a seguir mostra as aposentadorias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para uso no Foundation Model APIs, que serve cargas de trabalho pay-per-tokens. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Em 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct Substituído o suporte para Meta-Llama-3.1-70B-Instruct no endpoint do Foundation Model APIs pay-per-tokens.
Modelo | Data de aposentadoria | Modelo de substituição recomendado |
---|---|---|
DBRX Instruct | 30 de abril de 2025 | Meta-Llama-3.3-70B-Instruct |
Instrução Mixtral-8x7B | 30 de abril de 2025 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3.1-70B-Instruct | 11 de dezembro de 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-3.3-70B-Instruct |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-3.3-70B-Instruct |
Instrução MPT 7B | 30 de agosto de 2024 | Meta-Llama-3.3-70B-Instruct |
Instrução MPT 30B | 30 de agosto de 2024 | Meta-Llama-3.3-70B-Instruct |
Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.