Modelos compatíveis com as APIs do Databricks Foundation Models

Este artigo descreve os modelos abertos de última geração que são compatíveis com o modelo da FundaçãoDatabricks APIs .

nota

Consulte Modelos de fundação suportados em Mosaic AI Model Serving para obter informações sobre a disponibilidade desses modelos na região e as áreas de recurso suportadas.

O senhor pode enviar solicitações de consulta a esses modelos usando o endpoint pay-per-tokens disponível em seu site Databricks workspace. Consulte a tabela Use foundation models and pay-per-tokens supported models para obter os nomes do endpoint do modelo a ser usado.

Além de oferecer suporte a modelos no modo pay-per-tokens, o Foundation Model APIs também oferece o modo de provisionamento Taxa de transferência. Databricks recomenda o provisionamento Taxa de transferência para cargas de trabalho de produção. Esse modo é compatível com todos os modelos de uma família de arquitetura de modelos (por exemplo, modelos DBRX), inclusive os modelos pré-treinados ajustados e personalizados compatíveis com o modo pay-per-tokens. Consulte o provisionamento Taxa de transferência Foundation Model APIs para obter a lista de arquiteturas compatíveis.

O senhor pode interagir com esses modelos suportados usando o AI Playground.

Meta Llama 4 Maverick

important

Consulte as licenças de desenvolvedor de modelos aplicáveis e os termos da licença e da política de uso aceitável do Llama 4 comunidade.

O Llama 4 Maverick é um modelo de linguagem grande de última geração criado e treinado pela Meta. É o primeiro da família de modelos Llama a usar uma arquitetura mista de especialistas para obter a eficiência do compute. O Llama 4 Maverick é compatível com vários idiomas e é otimizado para casos de uso precisos de compreensão de imagens e textos. Atualmente, o suporte da Databricks ao Llama 4 Maverick está limitado a casos de uso de compreensão de texto. Saiba mais sobre o Llama 4 Maverick.

Como ocorre com outros modelos de linguagem de grande porte, o resultado do Llama 4 pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Meta Llama 3.3 70B Instruct

important

A partir de 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct Substitui o suporte para Meta-Llama-3.1-70B-Instruct no modelo Foundation APIs pay-per-tokens endpoint.

Consulte as licenças de desenvolvedor de modelos aplicáveis e os termos da Licença da comunidade LLama 3.3 e da Política de uso aceitável.

O Meta-Llama-3.3-70B-Instruct é um modelo de linguagem grande de última geração com um contexto de 128.000 tokens que foi criado e treinado pelo Meta. O modelo oferece suporte a vários idiomas e é otimizado para casos de uso de diálogo. Saiba mais sobre o Meta Llama 3.3.

Semelhante a outros modelos de linguagem de grande porte, o resultado do Llama-3 pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Meta Llama 3.1 405B Instruct

info

Visualização

O uso desse modelo com as APIs do Foundation Model está em Public Preview. Entre em contato com a equipe do Databricks account se o senhor encontrar falhas no endpoint ou erros de estabilização ao usar esse modelo.

Consulte as licenças e os termos do desenvolvedor de modelos aplicáveis para obter a Licença da comunidade Llama 3.1 e a Política de uso aceitável.

O Meta-Llama-3.1-405B-Instruct é o maior modelo de linguagem grande de última geração disponível abertamente, construído e treinado pela Meta. O uso desse modelo permite que os clientes desbloqueiem novos recursos, como raciocínio avançado em várias etapas e geração de dados sintéticos de alta qualidade. Este modelo é competitivo com o GPT-4-Turbo em termos de qualidade.

Como Meta-Llama-3.1-70B-Instruct, Esse modelo tem um contexto de 128.000 tokens e suporte em dez idiomas. Ele se alinha às preferências humanas de utilidade e segurança e é otimizado para casos de uso de diálogo. Saiba mais sobre os modelos Meta Llama 3.1.

Semelhante a outros modelos de linguagem grande, o Llama-3.1's O resultado pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Meta Llama 3.1 8B Instruct

important

Consulte as licenças de desenvolvedor de modelos aplicáveis e os termos da Licença da comunidade LLama 3.1 e da Política de uso aceitável.

O Meta-Llama-3.1-8B-Instruct é um modelo de linguagem grande de última geração com um contexto de 128.000 tokens que foi criado e treinado pelo Meta. O modelo oferece suporte a vários idiomas e é otimizado para casos de uso de diálogo. Saiba mais sobre o Meta Llama 3.1.

Anthropic Claude Soneto 4

important

Os clientes são responsáveis por garantir que cumpra compliance os termos da Anthropic Política de Uso Aceitável da.

O Claude Sonnet 4 é um modelo de raciocínio híbrido de última geração, criado e treinado pela Anthropic. Esse modelo oferece dois modos: respostas quase instantâneas e pensamento ampliado para um raciocínio mais profundo com base na complexidade da tarefa. O Claude Sonnet 4 é otimizado para várias tarefas, como desenvolvimento de código, análise de conteúdo de grande escala e desenvolvimento de aplicativos de agentes.

Como acontece com outros modelos de linguagem grandes, o resultado do Claude Sonnet 4 pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Esse endpoint é hospedado pela Databricks Inc. no AWS dentro do perímetro de segurança da Databricks.

Anthropic Claude Opus 4

important

Os clientes são responsáveis por garantir que cumpra compliance os termos da Anthropic Política de Uso Aceitável da.

O Claude Opus 4 é um modelo de raciocínio híbrido de última geração, criado e treinado pela Anthropic. Esse modelo oferece dois modos: respostas quase instantâneas e pensamento ampliado para um raciocínio mais profundo com base na complexidade da tarefa. O Claude Opus 4 é otimizado para várias tarefas, como geração avançada de código, orquestração de agentes, pesquisa entre fontes, criação de conteúdo e resumo usando retenção de contexto.

Como acontece com outros modelos de linguagem grandes, o resultado do Claude Opus 4 pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Esse endpoint é hospedado pela Databricks Inc. no AWS dentro do perímetro de segurança da Databricks.

Anthropic Claude 3.7 Soneto

important

Os clientes são responsáveis por garantir que cumpra compliance os termos da Anthropic Política de Uso Aceitável da.

Claude 3.7 O Sonnet é um modelo de raciocínio híbrido de última geração, criado e treinado pela Anthropic. Trata-se de um grande modelo de linguagem e de raciocínio capaz de responder rapidamente ou ampliar seu raciocínio com base na complexidade da tarefa. Quando no modo de pensamento estendido, as etapas de raciocínio do Claude 3.7 Sonnet são visíveis para o usuário. Claude 3.7 O Sonnet é otimizado para várias tarefas, como geração de código, raciocínio matemático e acompanhamento de instruções.

Como acontece com outros modelos de linguagem grandes, o resultado do Claude 3.7 pode omitir alguns fatos e, ocasionalmente, produzir informações falsas. A Databricks recomenda o uso da geração aumentada de recuperação (RAG) em cenários em que a precisão é especialmente importante.

Esse endpoint é hospedado pela Databricks Inc. no AWS dentro do perímetro de segurança da Databricks.

GTE Large (En)

important

O GTE Large (En) é fornecido sob e sujeito à Licença Apache 2.0, Copyright (c) The Apache Software Foundation, Todos os direitos reservados. Os clientes são responsáveis por garantir o compliance com as licenças de modelo aplicáveis.

O General Text Embedding (GTE) é um modelo de incorporação de texto que pode mapear qualquer texto para um vetor de incorporação de 1024 dimensões e uma janela de incorporação de 8192 tokens. Esses vetores podem ser usados em índices de vetores para LLMs e para tarefas como recuperação, classificação, resposta a perguntas, clustering ou pesquisa semântica. Esse endpoint serve a versão em inglês do modelo e não gera embeddings normalizados.

Os modelos de incorporação são especialmente eficazes quando usados em conjunto com LLMs para casos de uso de geração aumentada de recuperação (RAG). O GTE pode ser usado para encontrar trechos de texto relevantes em grandes blocos de documentos que podem ser usados no contexto de um LLM.

BGE Grande (En)

O BAAI General Embedding (BGE) é um modelo de incorporação de texto que pode mapear qualquer texto para um vetor de incorporação de 1024 dimensões e uma janela de incorporação de 512 tokens. Esses vetores podem ser usados em índices de vetores para LLMs e para tarefas como recuperação, classificação, resposta a perguntas, clustering ou pesquisa semântica. Esse endpoint serve a versão em inglês do modelo e gera embeddings normalizados.

Os modelos de incorporação são especialmente eficazes quando usados em conjunto com LLMs para casos de uso de geração aumentada de recuperação (RAG). O BGE pode ser usado para encontrar trechos de texto relevantes em grandes blocos de documentos que podem ser usados no contexto de um LLM.

Nos aplicativos RAG, o senhor pode melhorar o desempenho do seu sistema de recuperação incluindo um parâmetro de instrução. Os autores do BGE recomendam que se experimente a instrução "Represent this sentence for searching relevant passages:" para a incorporação de consultas, embora seu impacto no desempenho dependa do domínio.

Meta Llama 4 Maverick​

Meta Llama 3.3 70B Instruct​

Meta Llama 3.1 405B Instruct​

Meta Llama 3.1 8B Instruct​

Anthropic Claude Soneto 4​

Anthropic Claude Opus 4​

Anthropic Claude 3.7 Soneto​

GTE Large (En)​

BGE Grande (En)​

Recurso adicional​

Meta Llama 4 Maverick

Meta Llama 3.3 70B Instruct

Meta Llama 3.1 405B Instruct

Meta Llama 3.1 8B Instruct

Anthropic Claude Soneto 4

Anthropic Claude Opus 4

Anthropic Claude 3.7 Soneto

GTE Large (En)

BGE Grande (En)

Recurso adicional