governança de dados com Unity Catalog
Este guia mostra como gerenciar dados e AI o acesso a objetos em Databricks. Para obter informações sobre a segurança do site Databricks, consulte Security and compliance. Databricks fornece governança centralizada para dados e AI com Unity Catalog e Delta Sharing.
Centralize o controle de acesso usando o Unity Catalog
Unity Catalog é uma solução de governança refinada para dados e AI na plataforma Databricks. Ele ajuda a simplificar a segurança e a governança de seus dados e AI ativo, fornecendo um local central para administrar e auditar o acesso aos dados e AI ativo.
Na maioria das contas, o Unity Catalog é ativado pelo default quando o senhor cria um workspace. Para obter detalhes, consulte Ativação automática do Unity Catalog.
Para uma discussão sobre como usar o Unity Catalog de forma eficaz, consulte as práticas recomendadas do Unity Catalog.
Rastrear a linhagem de dados usando o Unity Catalog
O senhor pode usar o site Unity Catalog para capturar a linhagem de dados em tempo de execução em consultas em qualquer idioma executadas em um clustering Databricks ou SQL warehouse. A linhagem é capturada até o nível da coluna e inclui Notebook, Job e dashboards relacionados à consulta. Para saber mais, consulte Capture e view linhagem de dados usando Unity Catalog.
Descobrir o uso de dados Catalog Explorer
Databricks O Catalog Explorer fornece uma interface de usuário para explorar e gerenciar dados e AI ativos, incluindo esquemas (bancos de dados), tabelas, volumes (dados não tabulares) e modelos ML registrados, juntamente com permissões de ativos, proprietários de dados, locais externos e credenciais. O senhor pode usar as percepções tab no Catalog Explorer para view as consultas e os usuários recentes mais frequentes de qualquer tabela registrada em Unity Catalog.
Compartilhar uso de dados Delta Sharing
Delta Sharing é um protocolo aberto desenvolvido pela Databricks para dados seguros e AI compartilhamento ativo com outras organizações ou com outras equipes dentro de sua organização, independentemente das plataformas de computação que utilizam.
Configurar o registro de auditoria
Databricks fornece acesso à auditoria logs das atividades realizadas pelos usuários do Databricks, permitindo que sua empresa monitore os padrões detalhados de uso do Databricks.
Unity Catalog permite que o senhor acesse e consulte facilmente os dados operacionais do seu account, incluindo auditoria logs, uso faturável e linhagem usando tabelas do sistema (Public Preview).
Configurar identidade
Toda boa história de governança de dados começa com uma forte base de identidade. Para saber como configurar melhor a identidade no Databricks, consulte Práticas recomendadas de identidade.
Legacy governança de dados soluções
A Databricks também fornece esses modelos de governança herdados:
-
O controle de acesso da tabela é um modelo de governança de dados legado que permite que o senhor conceda e revogue de forma programática o acesso a objetos gerenciados pelo seu workspace's integrado Hive metastore. Databricks recomenda que o senhor use o site Unity Catalog em vez do controle de acesso da tabela. Unity Catalog simplifica a segurança e a governança de seus dados, fornecendo um local central para administrar e auditar o acesso aos dados em vários espaços de trabalho em seu site account.
-
IAM role O credential passthrough também é um recurso de governança de dados legado que permite que os usuários se autentiquem automaticamente em S3 buckets do clustering Databricks usando a identidade que eles usam para log in para Databricks. A Databricks recomenda que o senhor use o Unity Catalog em vez disso.