Serviços de modelo no Unity Catalog
Beta
Este recurso está em Beta. Administradores do account podem controlar o acesso a este recurso do console do account, na página **Prévias**. Consulte Gerenciar prévias do Databricks.
O Unity AI Gateway não é compatível com o AWS GovCloud.
Um serviço de modelo é um objeto securable do Unity Catalog que representa um endpoint LLM governado. Serviços de modelo permitem que você defina, compartilhe e governe o acesso a LLMs centralmente no Unity Catalog, junto com seus dados e entre os limites do workspace.
Durante a versão Beta, os serviços de modelo oferecem suporte ao seguinte:
- Modelos de fundação pay-per-tokens hospedados pelo Databricks , como serviços fornecidos pelo sistema em
system.aie como serviços que você cria. - Criação e gerenciamento de serviços de modelo com a UI do Unity AI Gateway, o Catalog Explorer e a API REST do Unity Catalog.
- Consultando serviços de modelo entre workspaces, dentro e fora do Databricks.
O que é um serviço de modelo?
Um serviço de modelo reside em um esquema do Unity Catalog e faz referência a um ou mais modelos servidos como destinos, com roteamento e fallback entre eles. Os chamadores invocam o serviço de modelo pelo seu nome totalmente qualificado, e o Unity AI Gateway encaminha cada solicitação para um modelo de destino.
Como um serviço de modelo é um objeto protegível do Unity Catalog, ele:
- Reside em um catálogo e esquema , onde herda as configurações do esquema, como vinculações de workspace.
- Contém metadados padrão do Unity Catalog , como nome, proprietário, comentário e tags.
- É governado por privilégios do Unity Catalog , então você concede acesso usando as mesmas declarações
GRANTeREVOKEque você usa para tabelas, funções e modelos. - É detectável no Catalog Explorer , juntamente com o restante dos seus ativos do Unity Catalog.
O mesmo serviço de modelo também aparece como um endpoint na UI do Unity AI Gateway, onde as equipes de AI podem configurar recursos como limites de taxa, tabelas de inferência e guardrails. Para saber mais sobre esses recursos, consulte Unity AI Gateway para agentes e serviços de modelo (herdado).
Por que governar LLMs no Unity Catalog?
Os endpoints do Unity AI Gateway criados em um workspace têm o escopo definido para esse workspace. Para compartilhar um endpoint entre workspaces, você deve duplicá-lo em cada workspace e gerenciar cada cópia separadamente.
Os serviços de modelo movem a governança para o Unity Catalog, para que você possa:
- Defina um endpoint de LLM uma vez e use-o de qualquer workspace anexado ao mesmo metastore.
- Governe o acesso centralmente usando privilégios do Unity Catalog, em vez de permissões por workspace.
- Descubra modelos que estão disponíveis para você em todos os workspaces a partir de um único local.
- Rastreie o uso e o custo para serviços de modelo em tabelas de sistema do Unity Catalog.
Serviços de modelo fornecidos pelo sistema
A Databricks oferece um serviço de modelo pronto para uso no esquema system.ai para cada modelo base hospedado pela Databricks, como system.ai.databricks-claude-opus-4-6. A Databricks adiciona novos serviços de modelo de sistema à medida que novos modelos base se tornam disponíveis.
Serviços de modelo fornecidos pelo sistema têm as seguintes características:
- Por default, todos os usuários de account têm o privilégio
EXECUTE, então você pode consultá-los sem configuração adicional. - Um usuário do sistema é o proprietário deles, e você não pode excluí-los.
- default, apenas administradores do metastore podem modificá-los. Um administrador do metastore pode delegar o gerenciamento concedendo o privilégio
MANAGE.
Para restringir o acesso a serviços de modelo fornecidos pelo sistema, consulte governar serviços de modelo.
Privilégios
Os serviços de modelo utilizam o modelo de privilégios padrão do Unity Catalog. Os seguintes privilégios se aplicam:
Privilégio | Descrição |
|---|---|
| Acesse o catálogo e o esquema que contêm o serviço de modelo. Necessário para todas as operações. |
| Crie serviços de modelo em um esquema. Concedido no catálogo ou esquema. |
| Consultar um serviço de modelo. |
| Modificar ou excluir um serviço de modelo e gerenciar suas concessões. O proprietário tem um superconjunto de |
Quando um usuário consulta um serviço de modelo, o Databricks verifica se o proprietário tem EXECUTE nos modelos referenciados (direitos do definidor). O chamador não precisa de acesso direto aos modelos subjacentes.
Limitações
As seguintes funcionalidades não estão disponíveis durante a versão Beta:
- Modelos de Taxa de transferência de provisionamento e provedores de modelos externos.
- Criação e gerenciamento de serviços de modelo com Terraform ou SQL.
- Descoberta de serviços de modelo com apenas o privilégio
BROWSE. - Linhagem e pesquisa global para serviços de modelo.