Política de manutenção de modelos de IA generativa
Este artigo descreve a política de manutenção do modelo para as ofertas de treinamento do Modelo Foundation APIs pay-per-tokens e do ModeloMosaic AI .
Para continuar a oferecer suporte aos modelos mais modernos, o site Databricks poderá desativar modelos mais antigos ou atualizar os modelos suportados para as ofertas de pagamento por token do modelo Foundation APIs e de treinamento do modeloMosaic AI .
Modelo de política de aposentadoria
A política de aposentadoria a seguir se aplica somente aos modelos de chat e de conclusão.
Se um modelo estiver pronto para ser aposentado, o site Databricks tomará os seguintes passos para notificar os clientes:
Uma mensagem de aviso é exibida no cartão do modelo na página Serving do site Databricks workspace , indicando que o modelo está planejado para ser desativado.
Uma mensagem de aviso é exibida no menu dropdown para Mosaic AI Model treinamento in the Experiments tab que indica que o modelo está planejado para ser retirado.
A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que o modelo não terá mais suporte.
Depois que os clientes forem notificados sobre a próxima retirada do modelo, a Databricks retirará o modelo em 3 meses. Durante esse período, os clientes podem optar por migrar para um provisionamento Taxa de transferência endpoint para continuar usando o modelo após a data de fim de vida útil.
Consulte Modelos aposentados para obter uma lista dos modelos atualmente aposentados e as datas planejadas de aposentadoria.
Atualizações de modelos
Databricks pode enviar atualizações incrementais para modelos de pagamento por tokens para fornecer otimizações. Quando um modelo é atualizado, o URL do endpoint permanece o mesmo, mas o ID do modelo no objeto de resposta é alterado para refletir a data da atualização. Por exemplo, se uma atualização for enviada para llama-2-70b-chat
em 3/4/2024, o nome do modelo no objeto de resposta será atualizado de acordo com llama-2-70b-chat-030424
. Databricks mantém um histórico de versões das atualizações que os clientes podem consultar.
Modelos aposentados
A tabela a seguir mostra as aposentadorias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para uso no Foundation Model APIs, que serve cargas de trabalho pay-per-tokens. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Importante
A partir de 23 de julho de 2024, o Meta-Llama-3.1-70B-Instruct Substitui o suporte para Meta-Llama-3-70B-Instruct no modelo Foundation APIs pay-per-tokens endpoint.
Modelo |
Data de aposentadoria |
Modelo de substituição recomendado |
---|---|---|
Meta-Llama-3-70B-Instruct |
30 de outubro de 2024 |
Meta-Llama-3.1-70B-Instruct |
Meta-Llama-2-70B-Chat |
30 de outubro de 2024 |
Meta-Llama-3.1-70B-Instruct |
Instrução MPT 7B |
30 de agosto de 2024 |
Mixtral-8x7B |
Instrução MPT 30B |
30 de agosto de 2024 |
Mixtral-8x7B |
Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.