Habilitar pesquisa web
Beta
Esse recurso está em Beta. Administradores da conta podem controlar o acesso a este recurso na página Prévias do console da conta. Consulte Gerenciar prévias do Databricks.
Esta página descreve a pesquisa web no Databricks e como usá-la para fundamentar respostas de modelos com informação em tempo real da web. A pesquisa web está disponível para modelos básicos Gemini e OpenAI oferecidos por serviços de modelo no Unity AI Gateway, e para modelos Anthropic por meio do Model Context Protocol (MCP).
O que é a pesquisa na web?
A pesquisa na web permite que os modelos de base recuperem informações atualizadas da internet durante a geração da resposta. Quando a pesquisa na web está habilitada, o modelo pode pesquisar na web para encontrar informações relevantes e incorporá-las em sua resposta. Isso é útil para perguntas sobre eventos atuais, dados recentes ou qualquer tópico em que a informação em tempo real melhora a resposta.
Usar pesquisa na web
A forma como você ativa a pesquisa na web depende do provedor de modelo e da API que você usa:
- **Modelos Gemini**: Use o
google_searchparâmetro com a API de Conclusões de Chat ou a API Gemini do Google. - Modelos OpenAI : Use a ferramenta
web_searchcom a API de Respostas da OpenAI. - Modelos da Anthropic : Use um servidor MCP de pesquisa na web como You.com do Databricks Marketplace.
A pesquisa na Web por modelos OpenAI está disponível apenas por meio da API de Respostas. Não é compatível por meio da API de Conclusão de Chat.
Modelos Gemini com a API de Conclusão do Chat
Para habilitar a pesquisa na web para modelos Gemini usando a API de Conclusão do Chat, passe google_search como um parâmetro de nível superior no corpo da solicitação.
- Python
- REST API
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get('DATABRICKS_TOKEN'),
base_url="https://<workspace-url>/ai-gateway/mlflow/v1"
)
response = client.chat.completions.create(
model="system.ai.gemini-2-5-pro",
messages=[
{"role": "user", "content": "What are the best Italian restaurants in San Francisco?"}
],
extra_body={"google_search": {}}
)
print(response.choices[0].message.content)
curl \
-u token:$DATABRICKS_TOKEN \
-X POST \
-H "Content-Type: application/json" \
-d '{
"model": "system.ai.gemini-2-5-pro",
"messages": [
{"role": "user", "content": "What are the best Italian restaurants in San Francisco?"}
],
"google_search": {}
}' \
https://<workspace-url>/ai-gateway/mlflow/v1/chat/completions
Modelos Gemini com a API Gemini do Google
Para habilitar a pesquisa na web usando a API Google Gemini, passe google_search como uma ferramenta.
- Python
- REST API
from google import genai
from google.genai import types
import os
DATABRICKS_TOKEN = os.environ.get('DATABRICKS_TOKEN')
client = genai.Client(
api_key="databricks",
http_options=types.HttpOptions(
base_url="https://<workspace-url>/ai-gateway/gemini",
headers={
"Authorization": f"Bearer {DATABRICKS_TOKEN}",
},
),
)
response = client.models.generate_content(
model="system.ai.gemini-2-5-pro",
contents=[
types.Content(
role="user",
parts=[types.Part(text="What are the best Italian restaurants in San Francisco?")],
),
],
config=types.GenerateContentConfig(
tools=[types.Tool(google_search=types.GoogleSearch())],
),
)
print(response.text)
curl \
-u token:$DATABRICKS_TOKEN \
-X POST \
-H "Content-Type: application/json" \
-d '{
"contents": [
{
"role": "user",
"parts": [{"text": "What are the best Italian restaurants in San Francisco?"}]
}
],
"tools": [
{"google_search": {}}
]
}' \
https://<workspace-url>/ai-gateway/gemini/v1beta/models/system.ai.gemini-2-5-pro:generateContent
Modelos OpenAI com a API de Respostas
Para habilitar a pesquisa na web para modelos OpenAI, passe web_search como uma ferramenta usando a API OpenAI Responses.
- Python
- REST API
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get('DATABRICKS_TOKEN'),
base_url="https://<workspace-url>/ai-gateway/mlflow/v1"
)
response = client.responses.create(
model="system.ai.gpt-5",
input=[
{"role": "user", "content": "What are the best Italian restaurants in San Francisco?"}
],
tools=[{"type": "web_search"}]
)
print(response.output_text)
curl \
-u token:$DATABRICKS_TOKEN \
-X POST \
-H "Content-Type: application/json" \
-d '{
"model": "system.ai.gpt-5",
"input": [
{"role": "user", "content": "What are the best Italian restaurants in San Francisco?"}
],
"tools": [
{"type": "web_search"}
]
}' \
https://<workspace-url>/ai-gateway/mlflow/v1/responses
Modelos Anthropic com MCP
A ferramenta de pesquisa web nativa da Anthropic não está disponível para modelos Anthropic hospedados no Databricks no Unity AI Gateway. Em vez disso, você pode adicionar pesquisa na web a modelos Anthropic usando o Model Context Protocol (MCP) com um provedor de pesquisa como You.com.
Configure o servidor MCP do You.com
- Navegue até Marketplace > Agents > MCP Servers no seu workspace Databricks.
- Procure por You.com e clique em Instalar .
- Configurar a conexão:
- Nome da conexão : Insira um nome (por exemplo,
youcom_web_search). - Token do portador: Insira sua chave da API You.com.
- Clique em Instalar .
- Conceda privilégios de **USE CONNECTION** a usuários ou grupos apropriados em **Catalog > Connections > [sua conexão] > Permissions**.
Após a configuração, o servidor MCP está disponível como uma ferramenta no AI Playground, para agentes e outros clientes compatíveis com MCP. A URL do endpoint proxy para sua conexão é:
https://<workspace_host>.databricks.com/api/2.0/mcp/external/<connection_name>
Usar com Claude Code
Se usar o Claude Code com modelos hospedados no Databricks no Unity AI Gateway, adicione o servidor MCP You.com para habilitar a pesquisa na web:
claude mcp add youcom-search \
--transport http \
--url "https://<workspace_host>.databricks.com/api/2.0/mcp/external/<connection_name>" \
--header "Authorization: Bearer <your-databricks-pat>"
Verifique se o servidor foi adicionado com claude mcp list.
Alternativamente, adicione o servidor diretamente a ~/.claude.json:
{
"mcpServers": {
"youcom-search": {
"type": "http",
"url": "https://<workspace_host>.databricks.com/api/2.0/mcp/external/<connection_name>",
"headers": {
"Authorization": "Bearer <your-databricks-pat>"
}
}
}
}
Modelos compatíveis
A pesquisa web é suportada em todos os modelos de fundação pay-per-tokens Gemini e OpenAI. Consulte modelos de fundação hospedados pela Databricks disponíveis nas APIs do Foundation Model para disponibilidade regional.
Modelos Gemini
databricks-gemini-3-1-prodatabricks-gemini-3-1-flash-litedatabricks-gemini-3-prodatabricks-gemini-3-flashdatabricks-gemini-2-5-prodatabricks-gemini-2-5-flash
modelos OpenAI
databricks-gpt-5-5-prodatabricks-gpt-5-5databricks-gpt-5-4databricks-gpt-5-4-minidatabricks-gpt-5-4-nanodatabricks-gpt-5-3-codexdatabricks-gpt-5-2databricks-gpt-5-2-codexdatabricks-gpt-5-1databricks-gpt-5-1-codex-maxdatabricks-gpt-5-1-codex-minidatabricks-gpt-5databricks-gpt-5-minidatabricks-gpt-5-nano
Modelos Anthropic (via MCP)
A pesquisa na web via MCP é compatível com todos os modelos de base da Anthropic que aceitam o uso de ferramentas.
databricks-claude-sonnet-4-6databricks-claude-sonnet-4-5databricks-claude-opus-4-7databricks-claude-opus-4-6databricks-claude-opus-4-5databricks-claude-opus-4-1databricks-claude-sonnet-4
Limitações
-
A pesquisa na web não está disponível para workspace com compliance HIPAA/BAA ativado, pois as consultas de pesquisa na web são enviadas para serviço de pesquisa externos que não são compatíveis com a HIPAA.
-
Os resultados da pesquisa na web dependem da capacidade do modelo de formular consultas de pesquisa e sintetizar resultados. A qualidade da resposta pode variar.
-
Para modelos OpenAI, a pesquisa na web está disponível apenas através da API de Respostas. A API de Conclusões de Chat não suporta pesquisa na web para modelos OpenAI.
-
A pesquisa na Web para modelos Gemini não está disponível quando o processamento entre regiões está desativado. O Gemini não oferece suporte ao processamento de pesquisa in-geo, portanto, qualquer workspace com aplicação de residência de dados não é elegível.
-
A busca na Web por modelos OpenAI não está disponível quando o processamento entre regiões está desabilitado, a menos que o workspace esteja em uma região geográfica elegível (Américas ou Europa). OpenAI oferece suporte ao processamento de busca na mesma região geográfica nestas regiões.