Pular para o conteúdo principal

Obter começar com Unity Catalog

O Unity Catalog é a camada de governança unificada para dados e AI no Databricks. Ele oferece controle de acesso centralizado, linhagem, auditoria e descobrimento de dados em seus workspaces. Consulte O que é o Unity Catalog?.

O Unity Catalog é habilitado automaticamente para todos os workspaces do Databricks criados após 6 de março de 2024. Se o Unity Catalog já estiver ativado no seu workspace, siga o tutorial de configuração. Se seu workspace antecede o Unity Catalog ou não foi habilitado na criação, siga o guia de atualização.

Estender sua configuração do Unity Catalog

Após a configuração do seu workspace, é possível aplicar recursos de governança mais avançados aos seus dados e fluxos de trabalho de AI.

Controle de acesso baseado em atributos

O controle de acesso baseado em atributos (ABAC) permite a definição de políticas de acesso dinâmicas e granulares com base nos atributos dos dados e do usuário que os acessa. Em vez de gerenciar permissões tabela por tabela, basta escrever políticas que aplicam automaticamente filtros de linha e máscaras de coluna. Por exemplo, é possível ocultar colunas confidenciais de usuários fora de uma região específica ou mascarar PII para funções não privilegiadas.

Mascaramento de coluna ABAC em ação

Classificação de dados

Classificação de dados usa um agente de AI para analisar automaticamente seu catálogo e marcar dados confidenciais como PII, informação financeira e credenciais. Após a classificação, as tags podem se integrar diretamente com as políticas ABAC, permitindo aplicar controles de governança com base no que os dados realmente contêm, em vez de gerenciar o acesso objeto por objeto.

Resultados da classificação de dados

Monitoramento da qualidade dos dados

Monitoramento da qualidade dos dados oferece detecção de anomalia em todas as tabelas em um esquema e perfil de dados no nível da tabela. Detecção de anomalia monitora automaticamente a atualização e a integridade usando padrões de data histórica, identificando problemas sem configuração manual. O perfil de dados captura distribuições estatísticas ao longo do tempo, permitindo o acompanhamento da integridade de dados e a definição de alertas para alterações inesperadas.

Dashboard de monitoramento da qualidade dos dados

linhagem de dados

A linhagem de dados captura automaticamente como os dados fluem entre tabelas, notebooks, jobs e pipelines, até o nível da coluna. É possível rastrear a origem de qualquer coluna, ver quais ativos downstream dependem dela e entender o impacto total de uma alteração de esquema antes de realizá-la.

Linhagem de dados em nível de coluna

Governança de IA com o Gateway de IA do Unity

Unity AI Gateway estende a governança do Unity Catalog para a IA. Ele fornece governança para endpoints de LLM, agentes e servidores MCP, permitindo implementar controle de acesso, registro de auditoria e observabilidade em todas as interações de IA em uma IU unificada.

Para uma visão geral completa das funcionalidades do Unity Catalog, consulte O que é o Unity Catalog?. Para as práticas recomendadas de governança, consulte práticas recomendadas do Unity Catalog.