Pular para o conteúdo principal

Generative AI modela a política de manutenção

Este artigo descreve a política de manutenção do modelo para o Foundation Model APIs pay-per-tokens e as ofertas do Foundation Model Fine-tuning.

Para continuar a oferecer suporte aos modelos mais modernos, o site Databricks pode atualizar os modelos suportados ou retirar os modelos mais antigos das ofertas de pagamento por token e de ajuste fino do Foundation Model APIs.

Política de aposentadoria modelo

A política de aposentadoria a seguir se aplica somente aos modelos de bate-papo e de conclusão suportados nas ofertas de pagamento por token do Foundation Model APIs e do Foundation Model Fine-tuning.

Quando um modelo é aposentado, ele não está mais disponível para uso e é removido das ofertas de recurso indicadas. A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:

  • Uma mensagem de aviso é exibida no cartão do modelo na página Serving do site Databricks workspace , indicando que o modelo está planejado para ser desativado.
  • Uma mensagem de aviso é exibida no menu dropdown para Foundation Model Fine-tuning no site Experiments tab, indicando que o modelo está planejado para ser desativado.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que não haverá mais suporte.

Depois que os usuários forem notificados sobre a próxima retirada do modelo, a Databricks retirará o modelo em três meses. Durante esse período de três meses, os clientes podem:

  • Opte por migrar para um provisionamento Taxa de transferência endpoint para continuar usando o modelo após a data de fim de vida útil.
  • Migrar o fluxo de trabalho existente para usar os modelos de substituição recomendados.

Na data de aposentadoria, o modelo é removido do produto e a documentação aplicável é atualizada para recomendar o uso de um modelo substituto.

Consulte Modelos aposentados para obter uma lista dos modelos atualmente aposentados e das datas planejadas de aposentadoria.

Atualizações do modelo

Databricks pode enviar atualizações incrementais para modelos de pagamento por tokens para fornecer otimizações. Quando um modelo é atualizado, o URL do endpoint permanece o mesmo, mas o ID do modelo no objeto de resposta é alterado para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. Databricks mantém um histórico de versões das atualizações que o senhor pode consultar.

Modelos aposentados

As seções a seguir resumem as aposentadorias de modelos atuais e futuras para as ofertas de pay-per-tokens do Foundation Model APIs e do Foundation Model Fine-tuning.

Foundation Model Ajustando as aposentadorias

A tabela a seguir mostra as famílias de modelos aposentados, suas datas de aposentadoria e as famílias de modelos de substituição recomendadas para usar nas cargas de trabalho de ajuste fino do Foundation Model. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.

Família de modelos

Data de aposentadoria

Família de modelos de substituição recomendada

DBRX

30 de abril de 2025

Lhama-3.1-70B

Mixtral

30 de abril de 2025

Lhama-3.1-70B

Mistral

30 de abril de 2025

Lhama-3.1-8B

Meta-Llama-3.1-405B

30 de janeiro de 2025

Lhama-3.1-70B

Meta-Lama-3

7 de janeiro de 2025

Meta-Lama-3.1

Meta-Lama-2

7 de janeiro de 2025

Meta-Lama-3.1

Código Llama

7 de janeiro de 2025

Meta-Lama-3.1

Modelo da Fundação APIs aposentadorias pay-per-tokens

A tabela a seguir mostra as aposentadorias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para uso no Foundation Model APIs, que serve cargas de trabalho pay-per-tokens. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.

important

Em 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct Substituído o suporte para Meta-Llama-3.1-70B-Instruct no endpoint do Foundation Model APIs pay-per-tokens.

Modelo

Data de aposentadoria

Modelo de substituição recomendado

DBRX Instruct

30 de abril de 2025

Meta-Llama-3.3-70B-Instruct

Instrução Mixtral-8x7B

30 de abril de 2025

Meta-Llama-3.3-70B-Instruct

Meta-Llama-3.1-70B-Instruct

11 de dezembro de 2024

Meta-Llama-3.3-70B-Instruct

Meta-Llama-3-70B-Instruct

23 de julho de 2024

Meta-Llama-3.3-70B-Instruct

Meta-Llama-2-70B-Chat

30 de outubro de 2024

Meta-Llama-3.3-70B-Instruct

Instrução MPT 7B

30 de agosto de 2024

Meta-Llama-3.3-70B-Instruct

Instrução MPT 30B

30 de agosto de 2024

Meta-Llama-3.3-70B-Instruct

Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.