Generative AI modela a política de manutenção
Este artigo descreve a política de manutenção de modelos para as ofertas de pay-per-tokens do modelo da Fundação APIs e de taxa de transferência de provisionamento do modelo da Fundação APIs.
Para continuar a oferecer suporte aos modelos mais modernos, a Databricks pode atualizar os modelos suportados ou retirar os modelos mais antigos dessas ofertas.
Política de aposentadoria modelo
A política de desativação de modelos explica como o Databricks notifica você quando um modelo compatível está programado para ser desativado, o que acontece durante o período de transição e o que esperar na data de desativação. Os prazos variam de acordo com a oferta e a categoria do modelo, conforme resumido nas seções a seguir.
Para modelos atualmente descontinuados e datas previstas de descontinuação, consulte Modelos descontinuados. Para modelos de parceiros, consulte política de aposentadoria do modelo de parceiros.
As políticas de aposentadoria que se aplicam ao Foundation Model APIs pay-per-tokens e às ofertas do Foundation Model Fine-tuning afetam apenas os modelos de bate-papo e de conclusão compatíveis.
Modelo de fundação APIs pay-per-tokens
A tabela a seguir resume a política de aposentadoria do Foundation Model APIs pay-per-tokens.
Notificação de aposentadoria | Transição para a aposentadoria | Na data de aposentadoria |
|---|---|---|
A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
| A Databricks aposentará o modelo em três meses . Durante esse período de três meses, os clientes podem:
| O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo substituto. |
Modelo de Fundação APIs provisionamento Taxa de transferência
A tabela a seguir resume a política de aposentadoria da Foundation Model APIs provisionamento Taxa de transferência.
Notificação de aposentadoria | Transição para a aposentadoria | Na data de aposentadoria |
|---|---|---|
A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
| A Databricks aposentará o modelo em seis meses . Durante esse período de seis meses:
| O modelo não está mais disponível para uso e foi removido do produto.
|
modelo de parcerias política de aposentadoria
Os modelos parceiros são modelos fornecidos por parceiros terceirizados, especificamente OpenAI, Anthropic e Google, que estão disponíveis por meio APIs do Foundation Model. Para estes modelos de parceiros, Databricks geralmente segue os mesmos cronogramas e políticas de depreciação descritos para os modelos de provisionamento Taxa de transferência e pagamento por tokens.
No entanto, as datas de aposentadoria fornecidas pelos parceiros podem ser mais curtas do que os períodos de transição publicados pela Databricks. Nesses casos, a Databricks tenta preencher a lacuna redirecionando temporariamente os modelos para uma versão semelhante, para que os clientes tenham o tempo de transição completo.
Por exemplo, se a descontinuação de um modelo de pagamento por tokens for anunciada com um mês de antecedência em vez de três, Databricks redireciona o modelo por mais dois meses para evitar interrupções imediatas e permitir tempo para a migração. As consultas falham ao final do período completo de três meses.
Esse redirecionamento só pode ocorrer se o modelo de substituição tiver o mesmo preço e for compatível com versões anteriores. O modelo de substituição geralmente é uma versão incremental, como da versão 3.0 para a 3.1.
Atualizações do modelo
A Databricks pode enviar atualizações incrementais do modelo para implementar otimizações. Quando um modelo é atualizado, a URL do endpoint permanece a mesma, mas o ID do modelo no objeto de resposta muda para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. Databricks mantém um histórico de versões das atualizações que você pode consultar.
Modelos aposentados
As seções a seguir resumem as descontinuações de modelos atuais e futuras para as ofertas de recursos indicadas.
Modelo da Fundação APIs aposentadorias pay-per-tokens
A tabela a seguir mostra as aposentadorias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para uso no Foundation Model APIs, que serve cargas de trabalho pay-per-tokens. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Data de aposentadoria | Modelo de substituição recomendado | |
|---|---|---|
OpenAI GPT-5.1 Codex Max | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
OpenAI GPT-5.1 Codex Mini | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
OpenAI GPT-5.2 Códice | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
Soneto Anthropic de Claude 3.7 | 12 de abril de 2026 | Use o modelo mais recente do Claude Sonnet. |
Modelo aberto | Data de aposentadoria | Modelo de substituição recomendado |
|---|---|---|
Meta-Llama-4-Maverick | 9 de março de 2026 | OpenAI GPT OSS 120B |
Meta Llama 3.1 405B | 15 de fevereiro de 2026 | OpenAI GPT OSS 120B |
Instrução Mixtral-8x7B | 30 de abril de 2025 | Meta-Llama-4-Maverick |
Meta-Llama-3.1-70B-Instruct | 11 de dezembro de 2024 | Meta-Llama-4-Maverick |
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-4-Maverick |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-4-Maverick |
Instrução MPT 7B | 30 de agosto de 2024 | Meta-Llama-4-Maverick |
Instrução MPT 30B | 30 de agosto de 2024 | Meta-Llama-4-Maverick |
Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.
Modelo da Fundação APIs provisionamento Taxa de transferência aposentadorias
A tabela a seguir mostra as aposentadorias de famílias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para o modelo da Fundação APIs provisionamento Taxa de transferência que atende às cargas de trabalho. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Data de aposentadoria | Modelo de substituição recomendado | |
|---|---|---|
Gemini 3 Pro | 26 de março de 2026 | Gemini 3.1 Pro. Para permitir mais tempo para a migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas de API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. Os preços para ambos os modelos são idênticos. |
Família modelo aberta | Data de aposentadoria | Modelo de substituição recomendado |
|---|---|---|
Meta-Llama-4-Maverick | 9 de junho de 2026 | OpenAI GPT OSS 120B |
Meta Llama 3.1 405B | 15 de maio de 2026 | OpenAI GPT OSS 120B |
Meta Llama 3 70B | 15 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Meta Llama 3 8B | 15 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Encontre cargas de trabalho que utilizam modelos obsoletos.
Use a seguinte consulta para encontrar cargas de trabalho que estejam usando modelos obsoletos e identificar seus proprietários.
SELECT
eu.requester,
se.endpoint_name,
se.entity_name,
COUNT(*) AS request_count,
SUM(eu.input_token_count) AS total_input_tokens,
SUM(eu.output_token_count) AS total_output_tokens,
MIN(eu.request_time) AS first_request,
MAX(eu.request_time) AS last_request
FROM system.serving.endpoint_usage eu
JOIN system.serving.served_entities se
ON eu.served_entity_id = se.served_entity_id
WHERE LOWER(se.entity_name) LIKE '%claude-opus-4-1%'
GROUP BY eu.requester, se.endpoint_name, se.entity_name
ORDER BY request_count DESC