Pular para o conteúdo principal

Desativar o acesso ao site Hive metastore usado por seu Databricks workspace

Este artigo descreve como desativar o acesso direto ao legado Hive metastore que é usado pelo seu Databricks workspace, seja o workspace-local Hive metastore ou um Hive metastore externo. Depois de concluir a migração para Unity Catalog ou federar seu Hive metastore como um catálogo externo que é governado por Unity Catalog, é possível usar uma configuração simples do administrador do workspace para impedir que os usuários contornem o Unity Catalog e acessem as tabelas registradas no Hive metastore.

Os dados em Hive metastore não são regidos por Unity Catalog. A desativação do acesso direto ao Hive metastore é uma etapa importante no processo de migração para o Unity Catalog e garante que o senhor aproveite ao máximo a governança de dados do Unity Catalog. O senhor pode desativar o acesso direto e continuar a consultar as tabelas gerenciadas pelo seu Hive metastore, aproveitando a federação Hive metastore. O senhor pode federar tabelas Hive metastore antes ou depois de desativar o acesso direto workspace ao Hive metastore. Consulte Migração workspace de Unity Catalog um existente para aHive metastore federação e: habilite o para governar tabelas registradas em Unity Catalog Hive metastore um.

Databricks recomenda que o senhor desative o acesso direto a Hive metastore para todos os clusters e cargas de trabalho de uma só vez, mas também pode usar uma configuração Spark para desativar o acesso em cada cluster.

Antes de começar: quando você deve desativar o metastore legado?

Antes de desativar o legado Hive metastore, o senhor deve atender aos seguintes critérios:

  • O senhor terminou de migrar todas as tabelas registradas no metastore legado para Unity Catalog, ou sempre usou Unity Catalog e nunca o legado Hive metastore.
  • Você quer forçar seus usuários a parar de usar tabelas registradas no metastore legado.
  • O senhor atualizou todos os trabalhos para Databricks Runtime 13.3 LTS ou acima.
  • Um account Unity Catalogadministrador do ativou o: Disable Legacy recurso na account página Previews do console.

O que acontece quando você desativa o metastore legado?

Depois de desativar o metastore legado:

  • Qualquer trabalho executado em tabelas registradas no site Hive metastore falhará.

  • O fallback está desativado.

  • Os trabalhos que forem executados em Databricks Runtime versões abaixo de 13.3 falharão.

    O trabalho em execução no momento continuará funcionando até ser encerrado, mas as reinicializações nesses clusters falharão.

  • O título Legacy e o catálogo hive_metastore desaparecem do painel do navegador Catalog Explorer.

  • SQL O comando que tentar mostrar o conteúdo do catálogo hive_metastore falhará.

nota

A desativação do acesso legado não impede que os usuários usem credenciais no nível do cluster, como entidade de serviço, que estão disponíveis em um cluster. Databricks recomenda que o senhor remova essas credenciais do seu clustering.

Não O clustering compartilhado de isolamento não respeita a configuração de desativação do legado Hive metastore. Para impedir que os usuários criem e usem esse clustering, ative a configuração Enforce User Isolation para o site workspace. Consulte Aplicar tipos de clustering de isolamento de usuário em um workspace.

Desativar todo o acesso direto ao Hive metastore

Desative o acesso legado do seu workspace Hive metastore usando a configuração Disable legacy access workspace admin:

  1. Como administrador do workspace, faça logon no seu workspace Databricks.

  2. Clique no menu do perfil do usuário no canto superior direito e selecione Configurações no menu.

  3. Acesse o workspace admin > Security .

  4. Defina Disable legacy access (Desativar acesso legado ) como Disabled (Desativado): o recurso de acesso legado não pode ser usado .

nota

Se essa configuração estiver ausente, peça a um administrador do account para ativar a configuração Previews > Unity Catalog: Disable Legacy recurso no console account.

  1. Para garantir que a nova configuração tenha entrado em vigor, aguarde aproximadamente cinco minutos.

  2. Reinicie todos os clusters em execução.

Desativar o acesso para compute clustering individual

O senhor pode desativar o acesso direto gradualmente, com base em cada cluster. Ignore as etapas da seção anterior e defina a seguinte configuração Spark em qualquer clustering que não sejaserverless:

spark.databricks.unityCatalogOnlyMode True

Essa abordagem pode ser útil durante uma migração para o site Unity Catalog quando o senhor deseja reduzir a dependência do Hive metastore de forma incremental até que possa desativá-lo para todo o workspace.

Consulte Configuração do Spark.