Governança de AI com Unity AI Gateway

info

Beta

Esta página aborda o novo Unity AI Gateway (visível na barra lateral da IU), que está atualmente em Beta. Os administradores da conta podem habilitar o acesso a este recurso na página Prévias do console da conta. Consulte Gerenciar prévias do Databricks.

Para obter detalhes sobre a versão anterior do AI Gateway (não o Unity AI Gateway), consulte AI Gateway para servir endpoint.

O Unity AI Gateway é a solução de governança da Databricks para AI corporativa. Construído sobre o Unity Catalog, ele estende a governança além de seus ativos de dados e AI para as interações de tempo de execução entre modelos, agentes, servidores MCP e ferramentas. Controle quais serviços de AI as equipes podem usar, rotear e gerenciar o tráfego de AI, definir guardrails e monitorar o uso a partir de um plano de controle.

Começar

Configure e aplique a governança de AI em todos os seus ativos de AI, tráfego e comportamento de serviço.

- Guia de governança de AI
- Um caminho de ponta a ponta para os administradores governarem o acesso a ativos de AI, tráfego e custo, e ao conteúdo de solicitações e respostas.
- Tutorial: Governe o acesso MCP do GitHub de um agente de codificação
- Restrinja o acesso de um agente de codificação às ferramentas MCP do GitHub usando permissões do Unity Catalog e uma política de serviço integrada.
- Tutorial: Implementar barreiras de segurança em um serviço de modelo com políticas de serviço
- Implemente barreiras de proteção em um serviço de modelo usando políticas de serviço integradas e personalizadas.

Controle quais serviços de AI as equipes podem usar

Registre ativos de IA como objetos securitizáveis do Unity Catalog e, em seguida, conceda e revogue o acesso com os mesmos privilégios que você usa para tabelas e volumes. Os agentes são governados por meio desses mesmos ativos securáveis: um agente é registrado como um modelo do Unity Catalog, e as ferramentas que ele chama são governadas como serviços MCP, funções e conexões.

- Modelos
- Gerenciar modelos ML registrados, incluindo modelos básicos hospedados pelo Databricks, com privilégios do Unity Catalog.
- Permissões de modelo básico
- Restrinja quais modelos de base hospedados no Databricks sua organização pode acessar, em toda a conta ou por grupo.
- Ferramentas MCP
- Governar servidores MCP registrados como objetos protegidos do Unity Catalog, com filtragem de ferramentas e políticas de serviço.
- Ferramentas personalizadas
- Governe as funções do Unity Catalog que os agentes usam como ferramentas, com os mesmos privilégios que você usa para dados.
- Conexões HTTP
- Governe as conexões do Unity Catalog usadas para acessar APIs externas e servidores MCP.
- Criar serviços de modelo
- Defina e compartilhe serviços de modelo como objetos securitizáveis do Unity Catalog em workspaces.

Roteie e gerenciar o tráfego de AI

O Unity AI Gateway encaminha as solicitações para seus serviços de modelo e MCP a partir de um plano de controle central, para que seja possível gerenciar a capacidade, a disponibilidade e os gastos entre provedores.

- Aplicar limites de taxa
- Aplique limites de consumo em serviços de modelo e serviços MCP para gerenciar capacidade e custo.
- Configure a divisão de tráfego e fallbacks.
- Distribua solicitações entre vários backends de modelo e adicione failover para aumentar a disponibilidade.
- Gerenciar orçamentos
- Monitore os gastos e defina limites por usuário e tetos máximos para provedores hospedados pelo Databricks e provedores externos.

nota

O recurso Unity AI Gateway não gera custos durante a versão Beta.

Defina limites de segurança e políticas de acesso

Políticas de serviço, também chamadas de guardrails, controlam como cada solicitação e resposta procede, com base em seu conteúdo e em quem está fazendo a chamada.

- Políticas de serviço para recursos protegíveis de IA
- Como as políticas de serviço governam o conteúdo de solicitações e respostas para serviços de AI, usando políticas integradas e personalizadas.
- Criar e anexar uma política de serviço
- Como escrever uma função de política de serviço e anexá-la a um MCP Service ou Model Service.

Monitorar uso, custo e risco

Acompanhe a atividade, os gastos e os resultados em todos os serviços do Unity AI Gateway.

- Monitore o uso
- Acompanhe solicitações, uso de tokens e latência para serviços de modelo usando tabelas do sistema.
- Analisar custo
- Atribua o custo do Databricks a serviços, modelos de destino, entidades de serviço e tags.
- Audite as solicitações e respostas
- Faça o log de solicitações e respostas em tabelas Delta do Unity Catalog para monitoramento e depuração.

endpoint de modelo de navegação (anterior)

A versão anterior do AI Gateway possui recursos de governança para endpoints de servindo modelo no nível do workspace, incluindo endpoints de modelo externos, endpoints de API de modelo de base e endpoints de modelo personalizados.

- Gateway AI para atendimento de endpoints
- Saiba mais sobre o recurso do AI Gateway para servir endpoints, incluindo recursos suportados e limitações.
- Configurar AI Gateway no endpoint do modelo intermediário
- Configure os recursos do AI Gateway, como acompanhamento de uso, registro de payloads, limites de taxa e proteções em um endpoint de modelo de serviço.
- Monitore os modelos utilizados com tabelas de inferência habilitadas pelo AI Gateway.
- Monitore os modelos utilizados com tabelas de inferência habilitadas pelo AI Gateway.

Começar​

Controle quais serviços de AI as equipes podem usar​

Roteie e gerenciar o tráfego de AI​

Defina limites de segurança e políticas de acesso​

Monitorar uso, custo e risco​

endpoint de modelo de navegação (anterior)​