Generative AI modela a política de manutenção

Esta página descreve a política de manutenção do modelo para as ofertas de APIs do Foundation Model (pagamento por token), APIs do Foundation Model (taxa de transferência provisionada) e Inferência em Lote com ai_query.

Para continuar a dar suporte aos modelos de última geração, a Databricks gerencia os modelos por meio de um ciclo de vida que progride da atualização para a descontinuação e, por fim, para a retirada.

Atualização : A Databricks aplica atualizações incrementais a um modelo para fornecer otimizações. Consulte Atualizações de modelo.
Descontinuado : Um modelo descontinuado não é mais recomendado para novas cargas de trabalho, mas permanece disponível em workspaces com uso existente do modelo. Workspaces que não estão usando o modelo no momento da descontinuação não têm mais acesso a ele.
Descontinuado : Um modelo descontinuado não está mais acessível e o suporte para o modelo é totalmente descontinuado. Qualquer carga de trabalho que usa o modelo para de funcionar.

Política de descontinuação de modelo

Quando a Databricks descontinua um modelo, esse modelo não é mais recomendado e está planejado para descontinuação. A Databricks anuncia as datas de descontinuação para modelos preteridos com os cronogramas de notificação resumidos nas seções a seguir. As datas de descontinuação podem ser anunciadas no momento da descontinuação ou em uma data posterior. Após a data de descontinuação, o modelo deixa de ser acessível e qualquer workload que o utilize para de funcionar.

Para modelos descontinuados e desativados e suas datas de desativação anunciadas, consulte Modelos descontinuados e desativados. Para modelos de parceiros, consulte Política de desativação de modelos de parceiros.

importante

As políticas de descontinuação que se aplicam às ofertas de pagamento por token das APIs do Foundation Model e de ajuste fino do Foundation Model impactam apenas os modelos de chat e conclusão compatíveis.

APIs do Foundation Model

A tabela a seguir resume a política de descontinuação para as APIs do Foundation Model (pagamento por tokens), APIs do Foundation Model (Taxa de transferência provisionada) e inferência em lotes com as ofertas ai_query.

Notificação de descontinuação	Transição para a aposentadoria	Na data de aposentadoria
A Databricks toma as seguintes medidas para notificar os clientes sobre a descontinuação de um modelo: Na interface do usuário do Databricks, uma mensagem de aviso indica que o modelo está descontinuado. A documentação aplicável contém um aviso que indica que o modelo está descontinuado, juntamente com uma data de desativação, se tiver sido anunciada.	Após descontinuar um modelo, a Databricks anuncia uma data de aposentadoria de três meses ou mais no futuro. Durante este período de transição: O modelo permanece disponível apenas para workspaces com cargas de trabalho existentes que o utilizam, até a data de descontinuação anunciada. O modelo descontinuado não é acessível de workspaces que não o estavam usando ativamente no momento da descontinuação. Clientes com cargas de trabalho existentes devem migrar para o modelo de substituição recomendado ou desativar as cargas de trabalho afetadas.	O modelo não está mais disponível para uso e é removido do produto. Qualquer carga de trabalho existente que usa o modelo para de funcionar. A documentação aplicável é atualizada para indicar que o modelo não está mais disponível e para recomendar um modelo de substituição.

Notificação de descontinuação

Transição para a aposentadoria

Na data de aposentadoria

A Databricks toma as seguintes medidas para notificar os clientes sobre a descontinuação de um modelo:

Na interface do usuário do Databricks, uma mensagem de aviso indica que o modelo está descontinuado.
A documentação aplicável contém um aviso que indica que o modelo está descontinuado, juntamente com uma data de desativação, se tiver sido anunciada.

Após descontinuar um modelo, a Databricks anuncia uma data de aposentadoria de **três meses** ou mais no futuro. Durante este período de transição:

O modelo permanece disponível apenas para workspaces com cargas de trabalho existentes que o utilizam, até a data de descontinuação anunciada.
O modelo descontinuado não é acessível de workspaces que não o estavam usando ativamente no momento da descontinuação.
Clientes com cargas de trabalho existentes devem migrar para o modelo de substituição recomendado ou desativar as cargas de trabalho afetadas.

O modelo não está mais disponível para uso e é removido do produto. Qualquer carga de trabalho existente que usa o modelo para de funcionar. A documentação aplicável é atualizada para indicar que o modelo não está mais disponível e para recomendar um modelo de substituição.

Notificação de descontinuação	Transição para a aposentadoria	Na data de aposentadoria
A Databricks toma as seguintes medidas para notificar os clientes sobre a descontinuação de um modelo: Na interface do usuário do Databricks, uma mensagem de aviso indica que o modelo está descontinuado. A documentação aplicável contém um aviso que indica que o modelo está descontinuado, juntamente com uma data de desativação, se tiver sido anunciada.	Após descontinuar um modelo, a Databricks anuncia uma data de aposentadoria de três meses ou mais no futuro. Durante este período de transição: O modelo permanece disponível apenas para workspaces com cargas de trabalho existentes que o utilizam, até a data de descontinuação anunciada. O modelo descontinuado não é acessível de workspaces que não o estavam usando ativamente no momento da descontinuação. Clientes com cargas de trabalho existentes devem migrar para o modelo de substituição recomendado ou desativar as cargas de trabalho afetadas.	O modelo não está mais disponível para uso e é removido do produto. Qualquer carga de trabalho existente que usa o modelo para de funcionar. A documentação aplicável é atualizada para indicar que o modelo não está mais disponível e para recomendar um modelo de substituição.

Notificação de descontinuação

Transição para a aposentadoria

Na data de aposentadoria

A Databricks toma as seguintes medidas para notificar os clientes sobre a descontinuação de um modelo:

Na interface do usuário do Databricks, uma mensagem de aviso indica que o modelo está descontinuado.
A documentação aplicável contém um aviso que indica que o modelo está descontinuado, juntamente com uma data de desativação, se tiver sido anunciada.

Após descontinuar um modelo, a Databricks anuncia uma data de aposentadoria de **três meses** ou mais no futuro. Durante este período de transição:

O modelo permanece disponível apenas para workspaces com cargas de trabalho existentes que o utilizam, até a data de descontinuação anunciada.
O modelo descontinuado não é acessível de workspaces que não o estavam usando ativamente no momento da descontinuação.
Clientes com cargas de trabalho existentes devem migrar para o modelo de substituição recomendado ou desativar as cargas de trabalho afetadas.

modelo de parcerias política de aposentadoria

Os modelos de parceiros são modelos que parceiros terceirizados — especificamente OpenAI, Anthropic e Google — fornecem por meio das APIs do Foundation Model. Para esses modelos de parceiros, a Databricks geralmente segue os mesmos prazos e políticas de descontinuação descritos acima.

No entanto, os parceiros podem fornecer datas de descontinuação mais curtas do que o período de transição de três meses que a Databricks publica. Nesses casos, a Databricks tenta superar a lacuna redirecionando temporariamente os modelos para uma versão semelhante, para que os clientes recebam o tempo de transição completo.

Por exemplo, se a descontinuação de um modelo de parceiro for anunciada com um mês de antecedência em vez de três, a Databricks redireciona o modelo por mais dois meses para evitar interrupções imediatas e permitir tempo para a migração. As consultas falham ao final do período completo de três meses.

nota

Esse redirecionamento só pode ocorrer se o modelo de substituição tiver o mesmo preço e for compatível com versões anteriores. O modelo de substituição geralmente é uma versão incremental, como da versão 3.0 para a 3.1.

Atualizações do modelo

A Databricks pode lançar atualizações incrementais de modelos para entregar otimizações. Quando a Databricks atualiza um modelo, a URL do endpoint permanece a mesma, mas o ID do modelo no objeto de resposta muda para refletir a data da atualização. Por exemplo, se a Databricks lançar uma atualização para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. A Databricks mantém um histórico de versões das atualizações. Entre em contato com a equipe de conta da Databricks para mais detalhes.

Modelos descontinuados e retirados

As seções a seguir listam modelos que foram descontinuados (não mais recomendados para novas cargas de trabalho) ou desativados (fim da vida útil e não mais disponíveis). As datas de desativação para modelos descontinuados são anunciadas com pelo menos três meses de antecedência.

Descontinuações das APIs do Foundation Model

A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados para usar com as cargas de trabalho de serviço por tokens e de Taxa de transferência de provisionamento das APIs do Foundation Model. A Databricks recomenda a migração de suas aplicações para utilizar modelos de substituição antes da data de desativação indicada.

modelo	Data de aposentadoria	Modelo de substituição recomendado
Anthropic Claude Sonnet 4	Pagamento por token: 9 de outubro de 2026	Claude Sonnet 4.6
OpenAI GPT-5.1 Codex Max	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.5
OpenAI GPT-5.1 Codex Mini	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.4 Codex Mini
OpenAI GPT-5.2 Códice	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.5
Soneto Anthropic de Claude 3.7	Pagamento por token: 12 de abril de 2026	Use o modelo mais recente do Claude Sonnet.
Gemini 2.5 Flash	Pagamento por token: 2 de outubro de 2026 Throughput provisionado: 2 de outubro de 2026	Gemini 3.1 Pro ou Gemini 3.5 Flash
Gemini 2.5 Pro	Throughput provisionado: 2 de outubro de 2026	Gemini 3.1 Pro ou Gemini 3.5 Flash
Gemini 3 Pro	Taxa de transferência de provisionamento: 26 de março de 2026	Gemini 3.1 Pro. Para permitir mais tempo para a migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas de API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. Os preços para ambos os modelos são idênticos.

modelo	Data de aposentadoria	Modelo de substituição recomendado
Anthropic Claude Sonnet 4	Pagamento por token: 9 de outubro de 2026	Claude Sonnet 4.6
OpenAI GPT-5.1 Codex Max	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.5
OpenAI GPT-5.1 Codex Mini	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.4 Codex Mini
OpenAI GPT-5.2 Códice	Pagamento por token: 16 de julho de 2026	OpenAI GPT-5.5
Soneto Anthropic de Claude 3.7	Pagamento por token: 12 de abril de 2026	Use o modelo mais recente do Claude Sonnet.
Gemini 2.5 Flash	Pagamento por token: 2 de outubro de 2026 Throughput provisionado: 2 de outubro de 2026	Gemini 3.1 Pro ou Gemini 3.5 Flash
Gemini 2.5 Pro	Throughput provisionado: 2 de outubro de 2026	Gemini 3.1 Pro ou Gemini 3.5 Flash
Gemini 3 Pro	Taxa de transferência de provisionamento: 26 de março de 2026	Gemini 3.1 Pro. Para permitir mais tempo para a migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas de API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. Os preços para ambos os modelos são idênticos.

Modelo aberto	Data de aposentadoria	Modelo de substituição recomendado
Meta-Llama-4-Maverick	Pagamento por token: 9 de março de 2026 Taxa de transferência provisionada: 9 de junho de 2026	OpenAI GPT OSS 120B
Meta Llama 3.1 405B	Pagamento por token: 15 de fevereiro de 2026 Taxa de transferência provisionada: 15 de maio de 2026	OpenAI GPT OSS 120B
Instrução Mixtral-8x7B	Pagamento por token: 30 de abril de 2025	Meta-Llama-4-Maverick
Meta Llama 3 (70B)	Pagamento por token: 23 de julho de 2024 (Meta-Llama-3-70B-Instruct); 11 de dezembro de 2024 (Meta-Llama-3.1-70B-Instruct) Taxa de transferência provisionada: 15 de fevereiro de 2026	Pagamento por token: Meta-Llama-4-Maverick Taxa de transferência provisionada: Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 3 8B	Taxa de transferência provisionada: 15 de fevereiro de 2026	Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta-Llama-2-70B-Chat	Pagamento por token: 30 de outubro de 2024	Meta-Llama-4-Maverick
Instrução MPT 7B	Pagamento por token: 30 de agosto de 2024	Meta-Llama-4-Maverick
Instrução MPT 30B	Pagamento por token: 30 de agosto de 2024	Meta-Llama-4-Maverick

Modelo aberto	Data de aposentadoria	Modelo de substituição recomendado
Meta-Llama-4-Maverick	Pagamento por token: 9 de março de 2026 Taxa de transferência provisionada: 9 de junho de 2026	OpenAI GPT OSS 120B
Meta Llama 3.1 405B	Pagamento por token: 15 de fevereiro de 2026 Taxa de transferência provisionada: 15 de maio de 2026	OpenAI GPT OSS 120B
Instrução Mixtral-8x7B	Pagamento por token: 30 de abril de 2025	Meta-Llama-4-Maverick
Meta Llama 3 (70B)	Pagamento por token: 23 de julho de 2024 (Meta-Llama-3-70B-Instruct); 11 de dezembro de 2024 (Meta-Llama-3.1-70B-Instruct) Taxa de transferência provisionada: 15 de fevereiro de 2026	Pagamento por token: Meta-Llama-4-Maverick Taxa de transferência provisionada: Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 3 8B	Taxa de transferência provisionada: 15 de fevereiro de 2026	Modelo comparável na mesma oferta, como o modelo Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta-Llama-2-70B-Chat	Pagamento por token: 30 de outubro de 2024	Meta-Llama-4-Maverick
Instrução MPT 7B	Pagamento por token: 30 de agosto de 2024	Meta-Llama-4-Maverick
Instrução MPT 30B	Pagamento por token: 30 de agosto de 2024	Meta-Llama-4-Maverick

Se o senhor precisar de suporte de longo prazo para uma versão de modelo específica, o site Databricks recomenda o uso do modelo Foundation APIs provisionamento Taxa de transferência para suas cargas de trabalho de serviço.

Encontre cargas de trabalho que utilizam modelos obsoletos.

Use a seguinte consulta para encontrar cargas de trabalho que estejam usando modelos obsoletos e identificar seus proprietários.

SQL
SELECT
   eu.requester,
   se.endpoint_name,
   se.entity_name,
   COUNT(*) AS request_count,
   SUM(eu.input_token_count) AS total_input_tokens,
   SUM(eu.output_token_count) AS total_output_tokens,
   MIN(eu.request_time) AS first_request,
   MAX(eu.request_time) AS last_request
 FROM system.serving.endpoint_usage eu
 JOIN system.serving.served_entities se
   ON eu.served_entity_id = se.served_entity_id
 WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
 GROUP BY eu.requester, se.endpoint_name, se.entity_name
 ORDER BY request_count DESC

Política de descontinuação de modelo​

APIs do Foundation Model​

modelo de parcerias política de aposentadoria​

Atualizações do modelo​

Modelos descontinuados e retirados​

Descontinuações das APIs do Foundation Model​

Encontre cargas de trabalho que utilizam modelos obsoletos.​