Chamada de função em Databricks

Este artigo descreve a chamada de função e como usá-la como parte de seu aplicativo generativo AI fluxo de trabalho. Databricks A Chamada de Função é compatível com OpenAI e só está disponível durante o atendimento ao modelo como parte do Foundation Model APIs e atendendo ao endpoint que atende a modelos externos.

O que é chamada de função?

A chamada de função fornece uma maneira de controlar a saída dos LLMs, para que eles gerem respostas estruturadas de forma mais confiável. Ao usar uma chamada de função, o senhor descreve as funções na chamada de API descrevendo os argumentos da função usando um esquema JSON. O LLM em si não chama essas funções, mas cria um objeto JSON que os usuários podem usar para chamar as funções em seu código.

Para a chamada de função no Databricks, a sequência básica de etapas é a seguinte:

Chame o modelo usando a consulta enviada e um conjunto de funções definidas no parâmetro tools.
O modelo decide se deve ou não chamar as funções definidas. Quando a função é chamada, o conteúdo é um objeto JSON de strings que adere ao seu esquema personalizado.
Analise o strings em JSON em seu código e chame sua função com os argumentos fornecidos, se existirem.
Chame o modelo novamente anexando a resposta estruturada como uma nova mensagem. A estrutura da resposta é definida pelas funções que você forneceu anteriormente em tools. A partir daqui, o modelo resume os resultados e envia esse resumo ao usuário.

Quando usar a chamada de função

Veja a seguir exemplos de casos de uso para chamada de função:

Crie assistentes que possam responder a perguntas chamando outras APIs. Por exemplo, você pode definir funções como send_email(to: string, body: string) ou current_weather(location: string, unit: 'celsius' | 'fahrenheit').
Definir e usar chamadas de API com base em linguagem natural. Como ouvir a declaração: “Quem são meus principais clientes?” e transformá-lo em uma chamada de API denominada get_customers(min_revenue: int, created_before: string, limit: int) e chamar essa API.

Para tarefas de inferência de lotes ou processamento de dados, como a conversão de dados não estruturados em dados estruturados. A Databricks recomenda o uso de saídas estruturadas.

Modelos compatíveis

A tabela a seguir lista os modelos suportados e qual modelo de recurso de atendimento torna cada modelo disponível. Consulte os termos e licenças de desenvolvedor de modelos aplicáveis para esses modelos.

Para modelos disponibilizados pelas APIs do modelo Foundation, consulte Limites das APIs do modelo Foundation para disponibilidade da região.
Para modelos disponibilizados por modelos externos, consulte Disponibilidade regional para ver a disponibilidade regional.

important

A partir de 11 de dezembro de 2024, Meta-Llama-3.3-70B-Instruct Substitui o suporte para Meta-Llama-3.1-70B-Instruct no modelo Foundation APIs pay-per-tokens endpoint.

Modelo	Disponibilizado usando o modelo de recurso servindo	Notas
GPT-5 (prévia)	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
GPT-5 mini (prévia)	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
GPT-5 nano (prévia)	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
Claude-Soneto-4.5	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
PERDA DE GPT 20B	APIs do modelo de fundação	Suportado por endpoints de pagamento por token e provisionamento de taxa de transferência.
PERDA DE GPT 120G	APIs do modelo de fundação	Suportado por endpoints de pagamento por token e provisionamento de taxa de transferência.
Gemma-3-12B	APIs do modelo de fundação	Suportado por endpoints de pagamento por token e provisionamento de taxa de transferência.
Claude-Soneto-4	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
Claude-Opus-4.1	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
Claude-3.7-Soneto	APIs do modelo de fundação	Suportado no endpoint pay-per-tokens.
Meta-Llama-4-Maverick	APIs do modelo de fundação	Com suporte para cargas de trabalho de pagamento por tokens e provisionamento.
Meta-Llama-3.3-70B-Instruct	APIs do modelo de fundação	Com suporte para cargas de trabalho de pagamento por tokens e provisionamento.
Meta-Llama-3.1-405B-Instruct	APIs do modelo de fundação	Com suporte para cargas de trabalho de pagamento por tokens e provisionamento. A partir de 31 de março de 2026, Meta-Llama-3.1-405B-Instruct será aposentado. Consulte Modelos descontinuados para obter o modelo de substituição recomendado e orientações sobre como migrar durante a descontinuação.
Meta-Llama-3.1-8B-Instruct	APIs do modelo de fundação	Com suporte para cargas de trabalho de pagamento por tokens e provisionamento.
gpt-4o	Modelos externos
gpt-4o-2024-08-06	Modelos externos
gpt-4o-2024-05-13	Modelos externos
gpt-4o-mini	Modelos externos
claude-3-5-sonnet-latest	Modelos externos	Anthropic fornecedor de modelos
claude-3-5-haiku-latest	Modelos externos	Anthropic fornecedor de modelos
claude-3-5-opus-latest	Modelos externos	Anthropic fornecedor de modelos
claude-3-5-soneto-20241022	Modelos externos	Anthropic fornecedor de modelos. Esse modelo suporta a chamada de ferramentas usando o uso do computador (beta).
claude-3-5-haiku-20241022	Modelos externos	Anthropic fornecedor de modelos
claude-3-5-soneto-20240620	Modelos externos	Anthropic fornecedor de modelos
claude-3-haiku-20240307	Modelos externos	Anthropic fornecedor de modelos
claude-3-opus-20240229	Modelos externos	Anthropic fornecedor de modelos
claude-3-soneto-20240229	Modelos externos	Anthropic fornecedor de modelos
claude-3-5-soneto-20241022-v 2:0	Modelos externos	Fornecedor do modelo Bedrock Anthropic. Esse modelo suporta a chamada de ferramentas usando o uso do computador (beta).
claude-3-5-haiku-20241022-v 1:0	Modelos externos	Bedrock Anthropic provedor de modelos
claude-3-5-soneto-20240620-v 1:0	Modelos externos	Bedrock Anthropic provedor de modelos
claude-3-soneto-20240229-v 1:0	Modelos externos	Bedrock Anthropic provedor de modelos
claude-3-opus-20240229-v 1:0	Modelos externos	Bedrock Anthropic provedor de modelos

Use a chamada de função

Para usar a chamada de função com seu aplicativo generativo AI, o senhor deve fornecer a função parameters e uma description.

O comportamento default para tool_choice é "auto". Isso permite que o modelo decida quais funções chamar e se deve chamá-las.

O senhor pode personalizar o comportamento do default dependendo do seu caso de uso. A seguir estão suas opções:

Conjunto tool_choice: "required". Nesse cenário, o modelo sempre chama uma ou mais funções. O modelo seleciona qual função ou funções chamar.
Conjunto tool_choice: {"type": "function", "function": {"name": "my_function"}}. Nesse cenário, o modelo chama somente uma função específica.
Defina tool_choice: "none" para desativar a chamada de função e fazer com que o modelo gere apenas uma mensagem voltada para o usuário.

A seguir, um exemplo de turno único usando o SDK da OpenAI e seu parâmetro tools. Consulte a tarefa Chat para obter mais detalhes sobre a sintaxe.

important

Durante o Public Preview, a chamada de função no Databricks é otimizada para chamadas de função de turno único.

Python
import os
import json
from openai import OpenAI

DATABRICKS_TOKEN = os.environ.get('YOUR_DATABRICKS_TOKEN')
DATABRICKS_BASE_URL = os.environ.get('YOUR_DATABRICKS_BASE_URL')

client = OpenAI(
  api_key=DATABRICKS_TOKEN,
  base_url=DATABRICKS_BASE_URL
  )

tools = [
  {
    "type": "function",
    "function": {
      "name": "get_current_weather",
      "description": "Get the current weather in a given location",
      "parameters": {
        "type": "object",
        "properties": {
          "location": {
            "type": "string",
            "description": "The city and state, e.g. San Francisco, CA"
          },
          "unit": {
            "type": "string",
            "enum": [
              "celsius",
              "fahrenheit"
            ]
          }
        }
      }
    }
  }
]

messages = [{"role": "user", "content": "What is the current temperature of Chicago?"}]

response = client.chat.completions.create(
    model="databricks-meta-llama-3-3-70b-instruct",
    messages=messages,
    tools=tools,
    tool_choice="auto",
)

print(json.dumps(response.choices[0].message.model_dump()['tool_calls'], indent=2))

Esse parâmetro também suporta o Uso do computador (beta) para os modelos Claude.

Esquema JSON

As APIs do Foundation Model suportam amplamente as definições de função aceitas pela OpenAI. No entanto, o uso de um esquema JSON mais simples para definições de chamadas de função resulta em uma geração de JSON de chamada de função de maior qualidade. Para promover uma geração de maior qualidade, as APIs do Foundation Model suportam apenas um subconjunto de especificações de esquema JSON.

A seguinte chave de definição de chamada de função não é suportada:

Expressões regulares usando pattern.
Composição e validação complexas aninhadas ou de esquemas usando: anyOf, oneOf, allOf, prefixItems ou $ref.
Listas de tipos, exceto no caso especial de [type, “null”], em que um tipo na lista é um tipo JSON válido e o outro é "null"

Além disso, as seguintes limitações se aplicam:

O número máximo de chaves especificado no esquema JSON é 16.
As APIs do Foundation Model não impõem restrições de comprimento ou tamanho para objetos e matrizes.
- Isso inclui palavras-chave como maxProperties, minProperties e maxLength.
Os esquemas JSON muito aninhados resultam em uma geração de qualidade inferior. Se possível, tente achatar o esquema JSON para obter melhores resultados.

uso de tokens

A injeção imediata e outras técnicas são usadas para melhorar a qualidade das chamadas de ferramentas. Isso afeta o número de tokens de entrada e saída consumidos pelo modelo, o que, por sua vez, resulta em implicações de faturamento. Quanto mais ferramentas o senhor usar, maior será o número de tokens de entrada.

Limitações

A seguir estão as limitações para a chamada de funções durante a Pré-visualização Pública:

Para chamadas de função com várias voltas, a Databricks recomenda os modelos Claude compatíveis.
Se estiver utilizando um Maverick com Llama 4, a função atual que chama soluções está otimizada para chamadas de função de volta única. A chamada de função de várias voltas é suportada durante a versão prévia, mas está em desenvolvimento.
A chamada de função paralela não é suportada.
O número máximo de funções que podem ser definidas em tools é 32 funções.
Para o suporte ao provisionamento da Taxa de transferência, a chamada de função só é suportada no novo endpoint. O senhor não pode adicionar chamadas de função a um endpoint criado anteriormente.

Notebook exemplo

Consulte o Notebook a seguir para obter exemplos detalhados de chamadas de funções

Exemplo de chamada de função Notebook

Open notebook in new tab

O que é chamada de função?​

Quando usar a chamada de função​

Modelos compatíveis​

Use a chamada de função​

Esquema JSON​

uso de tokens​

Limitações​

Notebook exemplo​