Obter começar com Unity Catalog
O Unity Catalog é a camada de governança unificada para dados e AI no Databricks. Ele oferece controle de acesso centralizado, linhagem, auditoria e descobrimento de dados em seus workspaces. Consulte O que é o Unity Catalog?.
O Unity Catalog é habilitado automaticamente para todos os workspaces do Databricks criados após 6 de março de 2024. Se o Unity Catalog já estiver ativado no seu workspace, siga o tutorial de configuração. Se seu workspace antecede o Unity Catalog ou não foi habilitado na criação, siga o guia de atualização.
-
- Guia de configuração do Unity Catalog
- Para espaços de trabalho com o Unity Catalog já ativado. Configurar funções de administrador, usuários, compute, permissões e catálogos.
-
- Atualizar para o Unity Catalog
- Para workspaces existentes ainda não no Unity Catalog. Habilite o Unity Catalog e migre seus dados.
Estender sua configuração do Unity Catalog
Após a configuração do seu workspace, é possível aplicar recursos de governança mais avançados aos seus dados e fluxos de trabalho de AI.
Controle de acesso baseado em atributos
O controle de acesso baseado em atributos (ABAC) permite a definição de políticas de acesso dinâmicas e granulares com base nos atributos dos dados e do usuário que os acessa. Em vez de gerenciar permissões tabela por tabela, basta escrever políticas que aplicam automaticamente filtros de linha e máscaras de coluna. Por exemplo, é possível ocultar colunas confidenciais de usuários fora de uma região específica ou mascarar PII para funções não privilegiadas.

Classificação de dados
Classificação de dados usa um agente de AI para analisar automaticamente seu catálogo e marcar dados confidenciais como PII, informação financeira e credenciais. Após a classificação, as tags podem se integrar diretamente com as políticas ABAC, permitindo aplicar controles de governança com base no que os dados realmente contêm, em vez de gerenciar o acesso objeto por objeto.

Monitoramento da qualidade dos dados
Monitoramento da qualidade dos dados oferece detecção de anomalia em todas as tabelas em um esquema e perfil de dados no nível da tabela. Detecção de anomalia monitora automaticamente a atualização e a integridade usando padrões de data histórica, identificando problemas sem configuração manual. O perfil de dados captura distribuições estatísticas ao longo do tempo, permitindo o acompanhamento da integridade de dados e a definição de alertas para alterações inesperadas.

linhagem de dados
A linhagem de dados captura automaticamente como os dados fluem entre tabelas, notebooks, jobs e pipelines, até o nível da coluna. É possível rastrear a origem de qualquer coluna, ver quais ativos downstream dependem dela e entender o impacto total de uma alteração de esquema antes de realizá-la.

Governança de IA com o Gateway de IA do Unity
Unity AI Gateway estende a governança do Unity Catalog para a IA. Ele fornece governança para endpoints de LLM, agentes e servidores MCP, permitindo implementar controle de acesso, registro de auditoria e observabilidade em todas as interações de IA em uma IU unificada.
Para uma visão geral completa das funcionalidades do Unity Catalog, consulte O que é o Unity Catalog?. Para as práticas recomendadas de governança, consulte práticas recomendadas do Unity Catalog.