Pular para o conteúdo principal

governança de dados com Unity Catalog

O Unity Catalog oferece um modelo unificado de governança de dados para o data lakehouse. Os administradores do SAP Databricks podem gerenciar permissões para equipes e indivíduos. Os privilégios são gerenciados com listas de controle de acesso (ACLs) por meio de UIs fáceis de usar ou da sintaxe do site SQL.

Esta página detalha orientações específicas para a governança de dados no SAP Databricks.

recurso

A seguinte governança de dados recurso está incluída no SAP Databricks:

Unity Catalog

Unity Catalog é uma solução de governança unificada para dados e AI ativo em Databricks. Unity Catalog oferece recursos centralizados de controle de acesso, auditoria, linhagem e descobrimento de dados no espaço de trabalho Databricks. Para saber mais sobre o modelo de objeto do Unity Catalog, consulte Objetos de banco de dados no SAP Databricks.

Centralize o controle de acesso usando o Unity Catalog

Unity Catalog é uma solução de governança refinada para dados e AI na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e AI ativo, fornecendo um local central para administrar e auditar o acesso aos dados e AI ativo.

Descobrir o uso de dados Catalog Explorer

Databricks O Catalog Explorer fornece uma interface de usuário para explorar e gerenciar dados e AI ativos, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos ML registrados, juntamente com permissões de ativos, proprietários de dados, locais externos e credenciais. O senhor pode usar as percepções tab no Catalog Explorer para view as consultas e os usuários recentes mais frequentes de qualquer tabela registrada em Unity Catalog. Consulte O que é o Catalog Explorer?.

Rastrear a linhagem de dados usando o Unity Catalog

O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um clustering SAP Databricks ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Consulte Capture e view linhagem de dados usando Unity Catalog.

Receba compartilhamentos de dados por meio do Delta Sharing

Delta Sharing é um protocolo aberto desenvolvido pela Databricks para dados seguros e AI compartilhamento ativo com outras organizações ou com outras equipes dentro de sua organização, independentemente das plataformas de computação que utilizam. No SAP Databricks, o senhor pode receber Delta Shares.

monitoramento da lagoa

Databricks O lakehouse monitoramento permite que o senhor monitore as propriedades estatísticas e a qualidade dos dados em todas as tabelas do seu site account. Para saber mais, consulte Monitorar dados e AI ativo com o lakehouse monitoramento. Para criar um monitor, consulte Criar um monitor usando a UI do Databricks.

Conecte-se a dados externos

Depois de ter locais externos configurados no Unity Catalog, você pode criar tabelas e volumes externos em diretórios dentro dos locais externos. Em seguida, pode usar o Unity Catalog para gerenciar o acesso de usuários e grupos a essas tabelas e volumes. Isso permite que você forneça a usuários ou grupos específicos acesso a diretórios e arquivos específicos no bucket de armazenamento em nuvem.

Evite a exfiltração de dados tornando os locais externos somente para leitura.