Pular para o conteúdo principal

O que é o Unity Catalog?

O Unity Catalog é a camada de governança unificada integrada ao Databricks. Quando ativado para um workspace, Unity Catalog opera automaticamente em todas as interações de dados no seu espaço de trabalho: aplicando controle de acesso ao consultar uma tabela, acompanhando a linhagem à medida que os dados são movidos, registrando atividades para auditoria e muito mais. Você trabalha com os objetos gerenciados pelo Unity Catalog por meio do Catalog Explorer, SQL, da CLI do Databricks e das APIs REST.

O Unity Catalog também está disponível como uma implementação de código aberto. Veja os blogs de anúncios e o Unity Catalog GitHub repositório público.

O modelo de objeto Unity Catalog

Cada atividade que você gerencia no Unity Catalog é modelada como um objeto protegível , um objeto no qual você pode conceder permissões a usuários, entidades de serviço ou grupos. Os dados ativos, como tabelas, visualizações, volumes, funções e modelos, seguem um namespace de três níveis (catalog.schema.object). Tabelas e volumes podem ser gerenciados internamente , onde Unity Catalog lida tanto com a governança quanto com o ciclo de vida subjacente do armazenamento de arquivos, ou externamente , onde Unity Catalog lida apenas com a governança. Outros objetos, como credenciais de armazenamento, locais externos, conexões e compartilhamentos, ficam diretamente abaixo do metastore.

Diagrama de modelo de objeto do Unity Catalog

As páginas seguintes explicam com mais detalhes os conceitos principais Unity Catalog e o fluxo de trabalho.

    • Objetos protegíveis
    • Aprenda sobre cada tipo de objeto na hierarquia Unity Catalog e como as permissões se aplicam a eles.
    • Requisitos e limitações
    • Analise os requisitos compute , os formatos de arquivo suportados, as restrições de nomenclatura e as limitações conhecidas.

RecursosUnity Catalog

Unity Catalog fornece ferramentas integradas para gerenciar todas as dimensões do seu ambiente de dados e AI . Os tópicos a seguir abrangem as principais áreas de competência.

    • Controle de acesso
    • Gerencie quem pode acessar o quê usando privilégios, políticas baseadas em atributos, filtros de linha e coluna e vinculações de workspace .
    • Descobrimento de dados
    • Interaja com objetos protegíveis usando o Catalog Explorer, a interface de usuário Databricks para descobrir e gerenciar dados e ativos AI registrados no Unity Catalog.
    • Linhagem de dados
    • Acompanhe automaticamente o fluxo e a transformação dos dados, da origem à visualização final e aos painéis de controle.
    • Auditoria
    • Mantenha um registro completo de todos os acessos a dados e atividades do sistema usando a tabela log auditoria do sistema.
    • Monitoramento da qualidade dos dados
    • Monitore proativamente a integridade dos dados com criação de perfis e alertas integrados que detectam anomalias antes que elas cheguem aos consumidores subsequentes.
    • Data Sharing
    • Compartilhe dados em tempo real e atividades AI de forma segura entre organizações e clouds usando o protocolo aberto Delta Sharing .
    • governança AI
    • Controle a atividade da AI e o tráfego AI usando Unity Catalog e AI Gateway.

Comece agora

O recurso a seguir ajudará você a começar a usar Unity Catalog. Se o seu workspace foi criado após 8 de novembro de 2023, ele será ativado automaticamente com Unity Catalog.

    • Comece a usar o Unity Catalog
    • Verifique se Unity Catalog já está habilitado para seu workspace e configure seu primeiro catálogo, esquema e controles de acesso a dados.

Recurso adicional