governança de dados com o Unity Catalog

Este guia mostra como gerenciar dados e acesso a objetos de IA no Databricks. Para obter informações sobre a segurança do Databricks, consulte o guia Security and compliance . A Databricks fornece governança centralizada para dados e IA com o Unity Catalog e o Delta Sharing.

Centralize o controle de acesso usando o Unity Catalog

O Unity Catalog é uma solução de governança refinada para dados e IA na plataforma Databricks. Ajuda a simplificar a segurança e a governança dos seus dados e da IA ativa, fornecendo um local central para administrar e auditar o acesso aos dados e à IA ativa.

Na maioria das contas, o Unity Catalog é ativado por default quando o senhor cria um workspace. Para obter detalhes, consulte Ativação automática do Unity Catalog.

Para uma discussão sobre como usar o Unity Catalog de forma eficaz, consulte as práticas recomendadas do Unity Catalog.

Rastreie a linhagem de dados usando o Unity Catalog

O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um Databricks cluster ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Para saber mais, consulte Capture e view linhagem de dados usando Unity Catalog.

Descubra o uso de dados Catalog Explorer

O Databricks Catalog Explorer fornece uma UI para explorar e gerenciar dados e IA ativa, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos de ML registrados, juntamente com permissões ativas, proprietários de dados, locais externos e credenciais. Você pode usar a percepções tab no Catalog Explorer para as view consultas e usuários recentes mais frequentes de qualquer tabela cadastrada no Unity Catalog.

Compartilhar uso de dados Delta compartilhamento

Delta Sharing é um protocolo aberto desenvolvido pela Databricks para compartilhamento seguro de dados e IA ativo com outras organizações ou com outras equipes dentro de sua organização, independentemente das plataformas de computação que utilizam.

Configurar o log de auditoria

A Databricks fornece acesso aos registros de auditoria das atividades realizadas pelos usuários da Databricks, permitindo que sua empresa monitore os padrões detalhados de uso da Databricks.

Unity Catalog permite que o senhor acesse e consulte facilmente os dados operacionais do seu account, incluindo auditoria logs, uso faturável e linhagem usando tabelas do sistema (Public Preview).

Configurar identidade

Toda boa história de governança de dados começa com uma forte base de identidade. Para saber como configurar melhor a identidade no Databricks, consulte Práticas recomendadas de identidade.

Soluções legadas de governança de dados

A Databricks também fornece esses modelos de governança herdados:

  • O controle de acesso da tabela é um modelo legado de governança de dados que permite conceder e revogar programaticamente o acesso a objetos gerenciados pelo Hive metastore integrado do seu espaço de trabalho. A Databricks recomenda que você use o Unity Catalog em vez do controle de acesso da tabela. O Unity Catalog simplifica a segurança e a governança dos seus dados, fornecendo um local central para administrar e auditar o acesso aos dados em vários workspace da sua account.

  • A passagem de credenciaisIAM role também é um recurso de governança de dados herdado que permite que os usuários se autentiquem automaticamente em buckets S3 de clusters do Databricks usando a identidade usada para log in no Databricks. A Databricks recomenda que você use Unity Catalog .