Pular para o conteúdo principal

Serviços de modelo no Unity Catalog

info

Beta

Este recurso está em Beta. Administradores do account podem controlar o acesso a este recurso do console do account, na página **Prévias**. Consulte Gerenciar prévias do Databricks.

nota

O Unity AI Gateway não é compatível com o AWS GovCloud.

Um serviço de modelo é um objeto securable do Unity Catalog que representa um endpoint LLM governado. Serviços de modelo permitem que você defina, compartilhe e governe o acesso a LLMs centralmente no Unity Catalog, junto com seus dados e entre os limites do workspace.

Durante a versão Beta, os serviços de modelo oferecem suporte ao seguinte:

  • Modelos de fundação pay-per-tokens hospedados pelo Databricks , como serviços fornecidos pelo sistema em system.ai e como serviços que você cria.
  • Criação e gerenciamento de serviços de modelo com a UI do Unity AI Gateway, o Catalog Explorer e a API REST do Unity Catalog.
  • Consultando serviços de modelo entre workspaces, dentro e fora do Databricks.

O que é um serviço de modelo?

Um serviço de modelo reside em um esquema do Unity Catalog e faz referência a um ou mais modelos servidos como destinos, com roteamento e fallback entre eles. Os chamadores invocam o serviço de modelo pelo seu nome totalmente qualificado, e o Unity AI Gateway encaminha cada solicitação para um modelo de destino.

Como um serviço de modelo é um objeto protegível do Unity Catalog, ele:

  • Reside em um catálogo e esquema , onde herda as configurações do esquema, como vinculações de workspace.
  • Contém metadados padrão do Unity Catalog , como nome, proprietário, comentário e tags.
  • É governado por privilégios do Unity Catalog , então você concede acesso usando as mesmas declarações GRANT e REVOKE que você usa para tabelas, funções e modelos.
  • É detectável no Catalog Explorer , juntamente com o restante dos seus ativos do Unity Catalog.

O mesmo serviço de modelo também aparece como um endpoint na UI do Unity AI Gateway, onde as equipes de AI podem configurar recursos como limites de taxa, tabelas de inferência e guardrails. Para saber mais sobre esses recursos, consulte Unity AI Gateway para agentes e serviços de modelo (herdado).

Por que governar LLMs no Unity Catalog?

Os endpoints do Unity AI Gateway criados em um workspace têm o escopo definido para esse workspace. Para compartilhar um endpoint entre workspaces, você deve duplicá-lo em cada workspace e gerenciar cada cópia separadamente.

Os serviços de modelo movem a governança para o Unity Catalog, para que você possa:

  • Defina um endpoint de LLM uma vez e use-o de qualquer workspace anexado ao mesmo metastore.
  • Governe o acesso centralmente usando privilégios do Unity Catalog, em vez de permissões por workspace.
  • Descubra modelos que estão disponíveis para você em todos os workspaces a partir de um único local.
  • Rastreie o uso e o custo para serviços de modelo em tabelas de sistema do Unity Catalog.

Serviços de modelo fornecidos pelo sistema

A Databricks oferece um serviço de modelo pronto para uso no esquema system.ai para cada modelo base hospedado pela Databricks, como system.ai.databricks-claude-opus-4-6. A Databricks adiciona novos serviços de modelo de sistema à medida que novos modelos base se tornam disponíveis.

Serviços de modelo fornecidos pelo sistema têm as seguintes características:

  • Por default, todos os usuários de account têm o privilégio EXECUTE, então você pode consultá-los sem configuração adicional.
  • Um usuário do sistema é o proprietário deles, e você não pode excluí-los.
  • default, apenas administradores do metastore podem modificá-los. Um administrador do metastore pode delegar o gerenciamento concedendo o privilégio MANAGE.

Para restringir o acesso a serviços de modelo fornecidos pelo sistema, consulte governar serviços de modelo.

Privilégios

Os serviços de modelo utilizam o modelo de privilégios padrão do Unity Catalog. Os seguintes privilégios se aplicam:

Privilégio

Descrição

USE CATALOG, USE SCHEMA

Acesse o catálogo e o esquema que contêm o serviço de modelo. Necessário para todas as operações.

CREATE SERVICE

Crie serviços de modelo em um esquema. Concedido no catálogo ou esquema.

EXECUTE

Consultar um serviço de modelo.

MANAGE

Modificar ou excluir um serviço de modelo e gerenciar suas concessões. O proprietário tem um superconjunto de MANAGE.

Quando um usuário consulta um serviço de modelo, o Databricks verifica se o proprietário tem EXECUTE nos modelos referenciados (direitos do definidor). O chamador não precisa de acesso direto aos modelos subjacentes.

Limitações

As seguintes funcionalidades não estão disponíveis durante a versão Beta:

  • Modelos de Taxa de transferência de provisionamento e provedores de modelos externos.
  • Criação e gerenciamento de serviços de modelo com Terraform ou SQL.
  • Descoberta de serviços de modelo com apenas o privilégio BROWSE.
  • Linhagem e pesquisa global para serviços de modelo.

Próximos os passos