Generative AI modela a política de manutenção
Este artigo descreve a política de manutenção do modelo para o Foundation Model APIs pay-per-tokens, Foundation Model APIs provisionamento Taxa de transferência e Foundation Model Fine-tuning offerings.
Para continuar a oferecer suporte aos modelos mais modernos, a Databricks pode atualizar os modelos suportados ou retirar os modelos mais antigos dessas ofertas.
Política de aposentadoria modelo
A política de desativação de modelos explica como o Databricks notifica você quando um modelo compatível está programado para ser desativado, o que acontece durante o período de transição e o que esperar na data de desativação. Os prazos variam de acordo com a oferta e a categoria do modelo, conforme resumido nas seções a seguir.
Para modelos atualmente descontinuados e datas previstas de descontinuação, consulte Modelos descontinuados. Para modelos de parceiros, consulte política de aposentadoria do modelo de parceiros.
As políticas de aposentadoria que se aplicam ao Foundation Model APIs pay-per-tokens e às ofertas do Foundation Model Fine-tuning afetam apenas os modelos de bate-papo e de conclusão compatíveis.
Modelo de fundação APIs pay-per-tokens
A tabela a seguir resume a política de aposentadoria do Foundation Model APIs pay-per-tokens.
Notificação de aposentadoria | Transição para a aposentadoria | Na data de aposentadoria |
|---|---|---|
A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
| A Databricks aposentará o modelo em três meses . Durante esse período de três meses, os clientes podem:
| O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo substituto. |
Modelo de Fundação APIs provisionamento Taxa de transferência
A tabela a seguir resume a política de aposentadoria da Foundation Model APIs provisionamento Taxa de transferência.
Notificação de aposentadoria | Transição para a aposentadoria | Na data de aposentadoria |
|---|---|---|
A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
| A Databricks aposentará o modelo em seis meses . Durante esse período de seis meses:
| O modelo não está mais disponível para uso e foi removido do produto.
|
modelo de parcerias política de aposentadoria
Os modelos parceiros são modelos fornecidos por parceiros terceirizados, especificamente OpenAI, Anthropic e Google, que estão disponíveis por meio APIs do Foundation Model. Para estes modelos de parceiros, Databricks geralmente segue os mesmos cronogramas e políticas de depreciação descritos para os modelos de provisionamento Taxa de transferência e pagamento por tokens.
No entanto, as datas de aposentadoria fornecidas pelos parceiros podem ser mais curtas do que os períodos de transição publicados pela Databricks. Nesses casos, a Databricks tenta preencher a lacuna redirecionando temporariamente os modelos para uma versão semelhante, para que os clientes tenham o tempo de transição completo.
Por exemplo, se a descontinuação de um modelo de pagamento por tokens for anunciada com um mês de antecedência em vez de três, Databricks redireciona o modelo por mais dois meses para evitar interrupções imediatas e permitir tempo para a migração. As consultas falham ao final do período completo de três meses.
Esse redirecionamento só pode ocorrer se o modelo de substituição tiver o mesmo preço e for compatível com versões anteriores. O modelo de substituição geralmente é uma versão incremental, como da versão 3.0 para a 3.1.
Ajuste fino do modelo básico
A tabela a seguir resume a política de aposentadoria para o Foundation Model Fine-tuning.
Notificação de aposentadoria | Transição para a aposentadoria | Na data de aposentadoria |
|---|---|---|
A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:
| A Databricks retira o modelo em três meses . Durante esse período de três meses, os clientes podem migrar o fluxo de trabalho existente para usar os modelos de substituição recomendados. | O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo substituto. |
Atualizações do modelo
A Databricks pode enviar atualizações incrementais do modelo para implementar otimizações. Quando um modelo é atualizado, a URL do endpoint permanece a mesma, mas o ID do modelo no objeto de resposta muda para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. Databricks mantém um histórico de versões das atualizações que você pode consultar.
Modelos aposentados
As seções a seguir resumem as descontinuações de modelos atuais e futuras para as ofertas de recursos indicadas.
Modelo da Fundação APIs aposentadorias pay-per-tokens
A tabela a seguir mostra as aposentadorias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para uso no Foundation Model APIs, que serve cargas de trabalho pay-per-tokens. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Data de aposentadoria | Modelo de substituição recomendado | |
|---|---|---|
Soneto Anthropic de Claude 3.7 | 12 de abril de 2026 | Use o modelo mais recente do Claude Sonnet. |
Modelo aberto | Data de aposentadoria | Modelo de substituição recomendado |
|---|---|---|
Meta Llama 3.1 405B | 15 de fevereiro de 2026 | OpenAI GPT OSS 120B |
DBRX Instruct | 30 de abril de 2025 | Meta-Llama-4-Maverick |
Instrução Mixtral-8x7B | 30 de abril de 2025 | Meta-Llama-4-Maverick |
Meta-Llama-3.1-70B-Instruct | 11 de dezembro de 2024 | Meta-Llama-4-Maverick |
Meta-Llama-3-70B-Instruct | 23 de julho de 2024 | Meta-Llama-4-Maverick |
Meta-Llama-2-70B-Chat | 30 de outubro de 2024 | Meta-Llama-4-Maverick |
Instrução MPT 7B | 30 de agosto de 2024 | Meta-Llama-4-Maverick |
Instrução MPT 30B | 30 de agosto de 2024 | Meta-Llama-4-Maverick |
Data de aposentadoria | Modelo de substituição recomendado | |
|---|---|---|
OpenAI GPT-5.1 Codex Max | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
OpenAI GPT-5.1 Codex Mini | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
OpenAI GPT-5.2 Códice | 16 de julho de 2026 | OpenAI GPT-5.3 Códice |
Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.
Modelo da Fundação APIs provisionamento Taxa de transferência aposentadorias
A tabela a seguir mostra as aposentadorias de famílias de modelos, suas datas de aposentadoria e os modelos de substituição recomendados para o modelo da Fundação APIs provisionamento Taxa de transferência que atende às cargas de trabalho. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Data de aposentadoria | Modelo de substituição recomendado | |
|---|---|---|
Gemini 3 Pro | 26 de março de 2026 | Gemini 3.1 Pro. Para permitir mais tempo para a migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas de API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. Os preços para ambos os modelos são idênticos. |
Família modelo aberta | Data de aposentadoria | Modelo de substituição recomendado |
|---|---|---|
Meta Llama 3.1 405B | 15 de maio de 2026 | OpenAI GPT OSS 120B |
Meta Llama 3 70B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Meta Llama 3 8B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Meta Llama 2 70B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Meta Llama 2 13B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Meta Llama 2 7B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Mixtral 8x7B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Mistral 7B | 27 de fevereiro de 2026 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
DBRX | 19 de dezembro de 2025 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
MPT 30B | 19 de dezembro de 2025 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
MPT 7B | 19 de dezembro de 2025 | Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante. |
Foundation Model Ajustando as aposentadorias
A tabela a seguir mostra as famílias de modelos aposentados, suas datas de aposentadoria e as famílias de modelos de substituição recomendadas para usar nas cargas de trabalho de ajuste fino do Foundation Model. A Databricks recomenda que o senhor migre seus aplicativos para usar modelos substitutos antes da data de aposentadoria indicada.
Família de modelos | Data de aposentadoria | Família de modelos de substituição recomendada |
|---|---|---|
DBRX | 30 de abril de 2025 | Lhama-3.1-70B |
Mixtral | 30 de abril de 2025 | Lhama-3.1-70B |
Mistral | 30 de abril de 2025 | Lhama-3.1-8B |
Meta-Llama-3.1-405B | 30 de janeiro de 2025 | Lhama-3.1-70B |
Meta-Lama-3 | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Meta-Lama-2 | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Código Llama | 7 de janeiro de 2025 | Meta-Lama-3.1 |
Encontre cargas de trabalho que utilizam modelos obsoletos.
Use a seguinte consulta para encontrar cargas de trabalho que estejam usando modelos obsoletos e identificar seus proprietários.
SELECT
eu.requester,
se.endpoint_name,
se.entity_name,
COUNT(*) AS request_count,
SUM(eu.input_token_count) AS total_input_tokens,
SUM(eu.output_token_count) AS total_output_tokens,
MIN(eu.request_time) AS first_request,
MAX(eu.request_time) AS last_request
FROM system.serving.endpoint_usage eu
JOIN system.serving.served_entities se
ON eu.served_entity_id = se.served_entity_id
WHERE LOWER(se.entity_name) LIKE '%claude-opus-4-1%'
GROUP BY eu.requester, se.endpoint_name, se.entity_name
ORDER BY request_count DESC