Pular para o conteúdo principal

Generative AI modela a política de manutenção

Este artigo descreve a política de manutenção de modelos para as ofertas de pay-per-tokens do modelo da Fundação APIs e de taxa de transferência de provisionamento do modelo da Fundação APIs.

Para continuar a oferecer suporte aos modelos mais modernos, a Databricks pode atualizar os modelos suportados ou retirar os modelos mais antigos dessas ofertas.

Política de aposentadoria modelo

As seções a seguir resumem a política de aposentadoria para as ofertas de recurso indicadas.

important

As políticas de aposentadoria que se aplicam ao Foundation Model APIs pay-per-tokens e às ofertas do Foundation Model Fine-tuning afetam apenas os modelos de bate-papo e de conclusão compatíveis.

Modelo de fundação APIs pay-per-tokens

A tabela a seguir resume a política de aposentadoria do Foundation Model APIs pay-per-tokens.

Notificação de aposentadoria

Transição para a aposentadoria

Na data de aposentadoria

A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:

  • Na página Serving do seu Databricks workspace, aparece uma mensagem de aviso no cartão do modelo que indica que o modelo está planejado para ser aposentado.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que não haverá mais suporte.

A Databricks aposentará o modelo em três meses . Durante esse período de três meses, os clientes podem:

  • Escolha migrar para um Foundation Model APIs provisionamento Taxa de transferência endpoint para continuar usando o modelo após a data de fim de vida útil.
  • Migrar o fluxo de trabalho existente para usar os modelos de substituição recomendados.

O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo substituto.

Modelo de Fundação APIs provisionamento Taxa de transferência

A tabela a seguir resume a política de aposentadoria da Foundation Model APIs provisionamento Taxa de transferência.

Notificação de aposentadoria

Transição para a aposentadoria

Na data de aposentadoria

A Databricks adota as seguintes medidas para notificar os clientes sobre um modelo que está pronto para ser desativado:

  • Para os endpoints que atendem a um modelo obsoleto, uma mensagem de aviso é exibida na página de detalhes do endpoint em seu Databricks workspace. Essa mensagem indica que o modelo está planejado para a aposentadoria e a data de aposentadoria aplicável.
  • Uma mensagem de dica de ferramenta fornece modelos alternativos recomendados para a migração da carga de trabalho.
  • A documentação aplicável contém um aviso que indica que o modelo está planejado para ser aposentado e a data de início em que não haverá mais suporte.

A Databricks aposentará o modelo em seis meses . Durante esse período de seis meses:

  • Os clientes podem continuar executando o endpoint de provisionamento existente usando o modelo obsoleto até a data de aposentadoria.
  • Todos os pontos de extremidade interrompidos que usam modelos obsoletos não podem ser reiniciados.
  • Os clientes que não estão usando ativamente um modelo obsoleto não podem criar um novo ponto de extremidade de provisionamento para um modelo obsoleto.

O modelo não está mais disponível para uso e foi removido do produto.

  • Todos os pontos de extremidade que usam o modelo desativado são transferidos para um estado de falha com uma mensagem descritiva. Todas as solicitações a esses endpoints falharão.
  • O cliente pode excluir os pontos de extremidade que usam o modelo desativado, mas não pode reiniciá-los.
  • A documentação aplicável é atualizada para recomendar o uso de um modelo substituto.

Atualizações do modelo

Databricks pode enviar atualizações incrementais para modelos de pagamento por tokens para fornecer otimizações. Quando um modelo é atualizado, o URL do endpoint permanece o mesmo, mas o ID do modelo no objeto de resposta é alterado para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. Databricks mantém um histórico de versões das atualizações que o senhor pode consultar.