Pular para o conteúdo principal

Governança de AI com Unity AI Gateway

info

Beta

Esta página aborda o novo Unity AI Gateway (visível na barra lateral da IU), que está atualmente em Beta. Os administradores da conta podem habilitar o acesso a este recurso na página Prévias do console da conta. Consulte Gerenciar prévias do Databricks.

Para obter detalhes sobre a versão anterior do AI Gateway (não o Unity AI Gateway), consulte AI Gateway para servir endpoint.

O Unity AI Gateway é a solução de governança da Databricks para AI corporativa. Construído sobre o Unity Catalog, ele estende a governança além de seus ativos de dados e AI para as interações de tempo de execução entre modelos, agentes, servidores MCP e ferramentas. Use-o para:

  • Controle quais serviços de AI as equipes podem usar : Faça o registro de modelos hospedados pela Databricks e modelos externos, serviços MCP e agentes no Unity Catalog e, em seguida, conceda acesso com privilégios padrão do Unity Catalog. A Databricks tem serviços de modelo básico por default, além de serviços MCP gerenciados para aplicativos como Google Drive, Jira, Slack e GitHub.
  • Encaminhe e gerencie o tráfego de AI : Encaminhe solicitações, defina limites de taxa, configure fallbacks e gerencie orçamentos entre modelos e serviços MCP. Limites rígidos de gastos interrompem as solicitações quando um orçamento é atingido, em vez de alertar depois do ocorrido.
  • Defina barreiras de segurança e políticas de acesso : anexe políticas de serviço para permitir, negar ou exigir aprovação para solicitações e respostas individuais. Políticas integradas protegem contra exposição de PII, injeção de prompt e conteúdo não seguro.
  • Monitorar uso, custo e risco: Rastreie quem usa quais serviços, quanto eles gastam e o que acontece durante cada solicitação, com rastreamento de agente unificado em toda a atividade de modelo e MCP.

É novo na governança de AI no Databricks? Consulte Comece com a governança de AI para um caminho de configuração de ponta a ponta.

Controle quais serviços de AI as equipes podem usar

O Unity Catalog gerencia ativos de AI como objetos protegíveis. Registre-os uma vez, em seguida, conceda e revogue o acesso usando os mesmos privilégios que você usa para tabelas e volumes:

Para definir e compartilhar serviço de modelo como objetos protegíveis do Unity Catalog entre workspace, consulte Criar e gerenciar serviço de modelo.

Roteie e gerenciar o tráfego de AI

O Unity AI Gateway encaminha as solicitações para seus serviços de modelo e serviços MCP a partir de um plano de controle central. É possível gerenciar capacidade, disponibilidade e gastos em provedores externos e hospedados pelo Databricks.

nota

O recurso Unity AI Gateway não gera custos durante a versão Beta.

Defina limites de segurança e políticas de acesso

As concessões de privilégios do Unity Catalog determinam se uma entidade pode chamar um serviço de AI. As políticas de serviço governam como essa interação prossegue, com base no conteúdo da solicitação e da resposta e em quem está fazendo a chamada. Isso é mais importante quando os agentes agem em nome dos usuários e acessam sistemas externos.

Uma política de serviço é um tipo de política de controle de acesso baseado em atributos (ABAC) com escopo para serviços de AI. Você pode permitir, negar ou exigir aprovação humana para uma interação com base no seu conteúdo. Por exemplo, você pode bloquear uma solicitação que contém informações pessoalmente identificáveis (PII) ou negar uma chamada de ferramenta fora da política. Verificadores de integridade são políticas de serviço integradas para riscos comuns, como PII, injeção de prompt e conteúdo inseguro. Consulte Políticas de serviço para ativos seguros de IA e Criar e anexar uma política de serviço.

Monitorar uso, custo e risco

É possível acompanhar atividades, gastos e resultados em todos os serviços do Unity AI Gateway.

    • Monitore o uso
    • Acompanhe solicitações, uso de tokens e latência para serviços de modelo usando tabelas do sistema.
    • Analisar custo
    • Atribua o custo do Databricks a serviços, modelos de destino, entidades de serviço e tags.

Como funciona em conjunto

O Unity AI Gateway baseia-se na governança do Unity Catalog em três camadas:

O monitoramento abrange todas as três camadas: você pode acompanhar o uso, custo e risco em ativos, tráfego e comportamento do serviço, incluindo quem usou qual serviço e o que aconteceu durante cada solicitação.

Começar

Os tópicos a seguir ajudam você a configurar e aplicar a governança de IA no Databricks.

endpoint de modelo de navegação (anterior)

A versão anterior do AI Gateway possui recursos de governança para endpoints de servindo modelo no nível do workspace, incluindo endpoints de modelo externos, endpoints de API de modelo de base e endpoints de modelo personalizados.