Pular para o conteúdo principal

governança de dados com Unity Catalog

Este guia mostra como gerenciar dados e AI o acesso a objetos em Databricks. Para obter informações sobre a segurança do site Databricks, consulte Security and compliance. Databricks fornece governança centralizada para dados e AI com Unity Catalog e Delta Sharing.

Centralize o controle de acesso usando o Unity Catalog

Unity Catalog é uma solução de governança refinada para dados e AI na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e AI ativo, fornecendo um local central para administrar e auditar o acesso aos dados e AI ativo.

Na maioria das contas, o Unity Catalog é ativado pelo default quando o senhor cria um workspace. Para obter detalhes, consulte Ativação automática do Unity Catalog.

Para uma discussão sobre como usar o Unity Catalog de forma eficaz, consulte as práticas recomendadas do Unity Catalog.

Rastrear a linhagem de dados usando o Unity Catalog

O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um clustering Databricks ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Para saber mais, consulte Capture e view linhagem de dados usando Unity Catalog.

Descobrir o uso de dados Catalog Explorer

Databricks O Catalog Explorer fornece uma interface de usuário para explorar e gerenciar dados e AI ativos, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos ML registrados, juntamente com permissões de ativos, proprietários de dados, locais externos e credenciais. O senhor pode usar as percepções tab no Catalog Explorer para view as consultas e os usuários recentes mais frequentes de qualquer tabela registrada em Unity Catalog.

Compartilhar uso de dados Delta Sharing

Delta Sharing é um protocolo aberto desenvolvido pela Databricks para dados seguros e AI compartilhamento ativo com outras organizações ou com outras equipes dentro de sua organização, independentemente das plataformas de computação que utilizam.

Configurar o registro de auditoria

Databricks fornece acesso à auditoria logs das atividades realizadas pelos usuários do Databricks, permitindo que sua empresa monitore os padrões detalhados de uso do Databricks.

Unity Catalog permite que o senhor acesse e consulte facilmente os dados operacionais do seu account, incluindo auditoria logs, uso faturável e linhagem usando tabelas do sistema (Public Preview).

Configurar identidade

Toda boa história de governança de dados começa com uma forte base de identidade. Para saber como configurar melhor a identidade no Databricks, consulte Práticas recomendadas de identidade.

Legacy governança de dados soluções

A Databricks também fornece esses modelos de governança herdados:

  • O controle de acesso da tabela é um modelo de governança de dados legado que permite que o senhor conceda e revogue de forma programática o acesso a objetos gerenciados pelo seu workspace's integrado Hive metastore. Databricks recomenda que o senhor use o site Unity Catalog em vez do controle de acesso da tabela. Unity Catalog simplifica a segurança e a governança de seus dados, fornecendo um local central para administrar e auditar o acesso aos dados em vários espaços de trabalho em seu site account.

  • IAM role O credential passthrough também é um recurso de governança de dados legado que permite que os usuários se autentiquem automaticamente em S3 buckets do clustering Databricks usando a identidade que eles usam para log in para Databricks. A Databricks recomenda que o senhor use o Unity Catalog em vez disso.

Esse artigo foi útil?