APIs do modelo da Fundação Databricks

Este artigo fornece uma visão geral do Foundation Model APIs em Databricks. Ele inclui requisitos de uso, modelos compatíveis e limitações.

O que são as APIs do Databricks Foundation Model?

O Mosaic AI Model Serving agora é compatível com as APIs do Foundation Model, que permitem que o senhor acesse e consulte modelos abertos de última geração a partir de um endpoint de serviço. Esses modelos são hospedados pela Databricks e o senhor pode criar aplicativos que os utilizam de forma rápida e fácil, sem manter sua própria implantação de modelos. O Foundation Model APIs é um serviço designado pela Databricks, o que significa que ele usa o Databricks Geos para gerenciar a residência de dados ao processar o conteúdo do cliente.

As APIs do Foundation Model são fornecidas nos seguintes modos:

Pay-per-token: essa é a maneira mais fácil de começar a acessar os modelos básicos no Databricks e é recomendada para iniciar sua jornada com as APIs dos modelos básicos. Esse modo não foi projetado para aplicações de alta taxa de transferência ou cargas de trabalho de produção de alto desempenho.
Taxa de transferência provisionada: esse modo é recomendado para todas as cargas de trabalho de produção, especialmente aquelas que exigem alta taxa de transferência, garantias de desempenho, modelos com ajuste fino ou que têm requisitos de segurança adicionais. Os endpoints da taxa de transferência provisionada estão disponíveis com certificações de compliance, como HIPAA.
AI Functions modelos otimizados: Esse modo é recomendado para cargas de trabalho de inferência de lotes. O senhor pode optar por executar lotes de inferência usando qualquer modelo generativo AI ou ML usando AI Functions.

Consulte Use Foundation Model APIs para obter orientação sobre como usar esses modos e os modelos compatíveis.

Usando as APIs do Foundation Model, o senhor pode fazer o seguinte:

Consulte um LLM generalizado para verificar a validade de um projeto antes de investir mais recurso.
Consultar um LLM generalizado para criar uma prova de conceito rápida para um aplicativo baseado em LLMantes de investir em treinamento e implantar um modelo personalizado.
Use um modelo básico, junto com um índice vetorial, para criar um chatbot usando a geração aumentada de recuperação (RAG).
Substitua modelos proprietários por alternativas abertas para otimizar custo e desempenho.
Compare com eficiência os LLMs para ver qual é o melhor candidato para seu caso de uso ou swap um modelo de produção com um de melhor desempenho.
Construa um aplicativo LLM para desenvolvimento ou produção em cima de uma solução de serviço LLM escalável e com SLA garantido que possa suportar seus picos de tráfego de produção.

Requisitos

Token da API do Databricks para autenticar solicitações de endpoint.
Computação serverless (para modelos de taxa de transferência provisionada).
Um workspace em uma das seguintes regiões suportadas:
- Regiões de pagamento por tokens.
- provisionamento Taxa de transferência regiões.

Usar APIs do Foundation Model

Você tem várias opções para usar as APIs do modelo básico.

As APIs são compatíveis com o OpenAI, portanto, o senhor pode usar o cliente OpenAI para fazer consultas. O senhor também pode usar a interface do usuário, o SDK Python das APIs do Foundation Models, o SDK do MLflow Deployments ou a API REST para consultar os modelos compatíveis. A Databricks recomenda usar o SDK ou a API do cliente OpenAI para interações estendidas e a interface do usuário para experimentar o recurso.

Consulte Usar modelos básicos para exemplos de pontuação.

Modelo de fundação pay-per-tokens APIs

Os endpoints pré-configurados que atendem aos modelos pay-per-tokens podem ser acessados em seu site Databricks workspace. Esses modelos pay-per-tokens são recomendados para começar. Para acessá-los em seu site workspace, navegue até Serving tab na barra lateral esquerda. O Foundation Model APIs está localizado na parte superior da lista de endpoints view.

Lista de endpoints de disponibilização

Modelos pay-per-tokens suportados.
Consulte Use foundation models para obter orientação sobre como consultar as APIs do Foundation Model.
Consulte a referência da API REST do modelo Foundation para obter os parâmetros e a sintaxe necessários.

provisionamento Taxa de transferência Foundation Model APIs

O provisionamento Taxa de transferência fornece ao endpoint uma inferência otimizada para cargas de trabalho do modelo de fundação que exigem garantias de desempenho. Databricks recomenda o provisionamento Taxa de transferência para cargas de trabalho de produção.

provisionamento Taxa de transferência arquiteturas de modelos suportados.
Consulte o provisionamento Taxa de transferência Foundation Model APIs para obter um guia passo a passo sobre como implantar o Foundation Model APIs no provisionamento em todo o modo.

O suporte da taxa de transferência provisionada inclui:

Modelos básicos de todos os tamanhos . Os modelos básicos podem ser acessados usando o Databricks Marketplace download Hugging Face site ou, alternativamente, o Unity Catalog senhor pode acessá-los em ou em outra fonte externa e registrá-los no site. A última abordagem funciona com qualquer variante ajustada dos modelos suportados.
Variantes ajustadas de modelos básicos, como modelos que são ajustados com base em dados proprietários.
Pesos e tokenizadores totalmente personalizados , como aqueles treinados do zero ou pré-treinados contínuos ou outras variações usando a arquitetura do modelo básico (por exemplo, CodelLama).

AI Functions para inferência de lotes

Consulte Aplicar AI em uso de dados Databricks AI Functions .

Consulte Realizar a inferência de lotes LLM usando AI Functions para saber como criar o pipeline de inferência de lotes usando AI Functions.

Limitações

Consulte os limites das APIs do Foundation Model.

O que são as APIs do Databricks Foundation Model?​

Requisitos​

Usar APIs do Foundation Model​

Modelo de fundação pay-per-tokens APIs​

provisionamento Taxa de transferência Foundation Model APIs​

AI Functions para inferência de lotes​

Limitações​

Recurso adicional​