Pular para o conteúdo principal

Crie catálogos

Este artigo mostra como criar catálogos em Unity Catalog. Um catálogo contém esquemas (bancos de dados), e um esquema contém tabelas, visualizações, volumes, modelos e funções.

Para saber mais sobre catálogos, consulte O que são catálogos no Databricks?

nota

Para saber como criar um catálogo externo , um objeto do Unity Catalog que espelha um banco de dados em um sistema de dados externo, consulte Criar um catálogo externo. Consulte também gerenciar e trabalhar com catálogos estrangeiros.

Requisitos

Para criar um catálogo, independentemente do tipo de catálogo:

  • O senhor deve ser um administrador do metastore da Databricks ou ter o privilégio CREATE CATALOG no metastore.
  • O recurso compute que o senhor usa para executar um Notebook para criar um catálogo deve estar no Databricks Runtime 11.3 ou superior e deve usar um modo de acesso compatível com o Unity Catalog. Consulte Modos de acesso. SQL O armazém sempre oferece suporte ao site Unity Catalog.

Para criar um catálogo compartilhado :

Para criar um catálogo padrão :

  • Se o senhor especificar um local de armazenamento gerenciar para o catálogo, deverá ter o privilégio CREATE MANAGED STORAGE no local externo de destino.
  • Se não houver armazenamento gerenciar no nível do metastore, o senhor deverá especificar um local de armazenamento gerenciar para o catálogo.

Para criar um catálogo estrangeiro :

  • Você deve ser o proprietário da conexão usada para criar o catálogo estrangeiro ou ter o privilégio CREATE FOREIGN CATALOG na conexão.
  • O senhor deve usar o site compute em Databricks Runtime 13.1 ou acima. SQL O warehouse deve ser Pro ou sem servidor.

Para criar um catálogo, o senhor pode usar o Catalog Explorer, um comando SQL, a API REST, a CLI da Databricks ou o Terraform. Quando você cria um catálogo, dois esquemas (bancos de dados) são criados automaticamente: default e information_schema.

  1. Efetue login em um workspace vinculado ao metastore.

  2. Clique em Ícone de catálogo Catálogo .

  3. Clique em Catálogos abaixo de Acesso rápido .

  4. Clique em Criar catálogo .

  5. Na caixa de diálogo Criar um novo catálogo , insira um nome de catálogo e selecione o tipo de catálogo que você deseja criar:

    • Catálogo padrão : um objeto seguro que organiza dados e AI ativos que são gerenciados por Unity Catalog. Para todos os casos de uso, exceto Lakehouse Federation e catálogos criados a partir de compartilhamentos Delta Sharing.
    • Catálogo externo : um objeto seguro que espelha um banco de dados em um sistema de dados externo usando a Lakehouse Federation. Veja a visão geral da configuração da Lakehouse Federation.
    • Catálogo compartilhado: um objeto seguro que organiza dados e outros ativos que são compartilhados com o senhor como um Delta Sharing compartilhamento. A criação de um catálogo a partir de um compartilhamento torna esses ativos disponíveis para leitura pelos usuários em seu site workspace. Consulte O que é um compartilhamento?.
  6. Dependendo do tipo de catálogo, especifique as seguintes opções:

    • Para catálogos padrão : É opcional, mas altamente recomendável que o senhor especifique um local de armazenamento gerenciar. O senhor deve ter o privilégio CREATE MANAGED STORAGE no local externo de destino usado como local de armazenamento gerenciado. Consulte Especificar um local de armazenamento gerenciar em Unity Catalog.

      Opcionalmente, você pode especificar um subcaminho de um local externo definido. Se você não tiver um local externo definido, poderá criar um clicando em Criar um novo local externo .

important

Se o site workspace não tiver um local de armazenamento em nível de metastore, o senhor deverá especificar um local de armazenamento gerenciar ao criar um catálogo.

  • Para catálogos externos : O senhor deve selecionar uma conexão , que é um objeto seguro no Unity Catalog que especifica um caminho e credenciais para acessar um sistema de banco de dados externo. Veja a visão geral da configuração da Lakehouse Federation.

    Depois de selecionar a conexão, digite o nome do banco de dados ou de outro catálogo do Databricks que deseja espelhar.

    Os requisitos diferem dependendo da fonte de dados:

    • O MySQL utiliza um namespace de duas camadas e portanto não exige um nome de banco de dados.
    • Para conexões com um catálogo em outro workspace do Databricks, insira o nome do Catálogo do Databricks em vez de um nome de banco de dados.

    Se você não tiver uma conexão definida, poderá criar uma clicando em Criar uma nova conexão .

  • Para catálogos compartilhados: você deve selecionar um Provedor e um Compartilhamento. Depois de selecionar o provedor, você pode selecionar uma das ações do provedor.

    Se você não tiver certeza de qual provedor e compartilhamento deseja, talvez seja mais fácil navegar ou pesquisar provedores e compartilhamentos usando o navegador Catalog Explorer. Veja os provedores de visualização e os compartilhamentos que um provedor compartilhou com o senhor.

  1. Clique em Criar .

  2. No catálogo criado! Na caixa de diálogo Configurar catálogo , clique em visualizar catálogo para aceitar o catálogo configurado automaticamente ou clique em Configurar catálogo (recomendado) para configurar as permissões do catálogo, as ligações workspace e os metadados.

    Se o senhor clicar em view catalog (visualizar catálogo) , o catálogo estará acessível a todos os espaços de trabalho anexados ao metastore e o privilégio BROWSE será concedido a todos os usuários account. Você pode pular o restante das etapas desse procedimento e continuar adicionando esquemas ao catálogo. Consulte Criar esquemas.

    O senhor pode retornar à página de detalhes do catálogo no Catalog Explorer a qualquer momento para atualizar o proprietário, as tags, os comentários, as ligações workspace, as permissões e os esquemas.

  3. Na página Configurar catálogo > workspace , especifique o workspace ao qual o catálogo está vinculado.

    Em default, o catálogo é compartilhado com todos os espaços de trabalho anexados ao metastore atual. Se o catálogo contiver dados que devam ser restritos a um espaço de trabalho específic o, desmarque a opção All workspace have access (Todos têm acesso ) e use o botão Assign to workspace (Atribuir ao espaço de trabalho ) para adicionar esse espaço de trabalho. O site workspace atual deve ser incluído.

    Depois de atribuir um workspace, o senhor pode opcionalmente alterar seu nível de acesso default Read & Write para Read Only : selecione o workspace na lista e clique no botão gerenciar Access Level .

    Para obter mais informações, consulte Limitar o acesso do catálogo a um espaço de trabalho específico.

  4. Clique em Avançar para atribuir permissões ao seu catálogo.

    Todos os usuários de account têm o privilégio BROWSE por default, o que lhes dá a capacidade de descobrir metadados do catálogo sem ter acesso de leitura aos dados.

    Para conceder um privilégio a um usuário, grupo ou entidade de serviço, clique em Grant (Conceder ) e siga as instruções em Unity Catalog privileges and securable objects (Privilégios e objetos protegidos do Unity Catalog).

  5. Clique em Avançar para adicionar metadados opcionais de tag e comentário.

    As tags são par key-valor que o senhor pode usar para organizar e categorizar catálogos para simplificar a pesquisa e a descoberta de seus dados ativos. Os valores são opcionais. Consulte Aplicar tags a objetos protegíveis do Unity Catalog.

    Um comentário é um campo aberto que é frequentemente usado para fornecer uma descrição para ajudar os usuários a descobrir os dados ativos no catálogo. Consulte Adicionar comentários aos dados e AI ativo.

  6. Clique em Salvar .

  7. Adicione esquemas e objetos de dados ao catálogo.

    Consulte Criar esquemas.

O senhor pode usar o Catalog Explorer para atualizar o proprietário, as tags, os comentários, os vínculos workspace e as permissões a qualquer momento após a criação do catálogo.

Mais informações