governança de dados com Unity Catalog
O Unity Catalog oferece um modelo unificado de governança de dados para o data lakehouse. Os administradores do SAP Databricks podem gerenciar permissões para equipes e indivíduos. Os privilégios são gerenciados com listas de controle de acesso (ACLs) por meio de UIs fáceis de usar ou da sintaxe do site SQL.
Esta página detalha orientações específicas para a governança de dados no SAP Databricks.
recurso
A seguinte governança de dados recurso está incluída no SAP Databricks:
- Unity Catalog
- Controles de acesso
- Monitoramento do lakehouse
- Receber dados por meio do Delta Sharing
- Conecte-se a dados externos
Unity Catalog
Unity Catalog é uma solução de governança unificada para dados e AI ativo em Databricks. Unity Catalog oferece recursos centralizados de controle de acesso, auditoria, linhagem e descobrimento de dados no espaço de trabalho Databricks. Para saber mais sobre o modelo de objeto do Unity Catalog, consulte Objetos de banco de dados no SAP Databricks.
Centralize o controle de acesso usando o Unity Catalog
Unity Catalog é uma solução de governança refinada para dados e AI na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e AI ativo, fornecendo um local central para administrar e auditar o acesso aos dados e AI ativo.
Descobrir o uso de dados Catalog Explorer
Databricks O Catalog Explorer fornece uma interface de usuário para explorar e gerenciar dados e AI ativos, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos ML registrados, juntamente com permissões de ativos, proprietários de dados, locais externos e credenciais. O senhor pode usar as percepções tab no Catalog Explorer para view as consultas e os usuários recentes mais frequentes de qualquer tabela registrada em Unity Catalog. Consulte O que é o Catalog Explorer?.
Rastrear a linhagem de dados usando o Unity Catalog
O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um clustering SAP Databricks ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Consulte Capture e view linhagem de dados usando Unity Catalog.
Receba compartilhamentos de dados por meio do Delta Sharing
Delta Sharing é um protocolo aberto desenvolvido pela Databricks para dados seguros e AI compartilhamento ativo com outras organizações ou com outras equipes dentro de sua organização, independentemente das plataformas de computação que utilizam. No SAP Databricks, o senhor pode receber Delta Shares.
monitoramento da lagoa
Databricks O lakehouse monitoramento permite que o senhor monitore as propriedades estatísticas e a qualidade dos dados em todas as tabelas do seu site account. Para saber mais, consulte Monitorar dados e AI ativo com o lakehouse monitoramento. Para criar um monitor, consulte Criar um monitor usando a UI do Databricks.
Conecte-se a dados externos
Depois de ter locais externos configurados no Unity Catalog, você pode criar tabelas e volumes externos em diretórios dentro dos locais externos. Em seguida, pode usar o Unity Catalog para gerenciar o acesso de usuários e grupos a essas tabelas e volumes. Isso permite que você forneça a usuários ou grupos específicos acesso a diretórios e arquivos específicos no bucket de armazenamento em nuvem.
Evite a exfiltração de dados tornando os locais externos somente para leitura.