Desativar o acesso ao site Hive metastore usado por seu Databricks workspace
Este artigo descreve como desativar o acesso direto ao legado Hive metastore que é usado pelo seu Databricks workspace, seja o workspace-local Hive metastore ou um Hive metastore externo. Depois de concluir a migração para Unity Catalog ou federar seu Hive metastore como um catálogo externo que é governado por Unity Catalog, é possível usar uma configuração simples do administrador do workspace para impedir que os usuários contornem o Unity Catalog e acessem as tabelas registradas no Hive metastore.
Os dados em Hive metastore não são regidos por Unity Catalog. A desativação do acesso direto ao Hive metastore é uma etapa importante no processo de migração para o Unity Catalog e garante que o senhor aproveite ao máximo a governança de dados do Unity Catalog. O senhor pode desativar o acesso direto e continuar a consultar as tabelas gerenciadas pelo seu Hive metastore, aproveitando a federação Hive metastore. O senhor pode federar tabelas Hive metastore antes ou depois de desativar o acesso direto workspace ao Hive metastore. Consulte Migração workspace de Unity Catalog um existente para aHive metastore federação e: habilite o para governar tabelas registradas em Unity Catalog Hive metastore um.
Databricks recomenda que o senhor desative o acesso direto a Hive metastore para todos os clusters e cargas de trabalho de uma só vez, mas também pode usar uma configuração Spark para desativar o acesso em cada cluster.
Antes de começar: quando você deve desativar o metastore legado?
Antes de desativar o legado Hive metastore, o senhor deve atender aos seguintes critérios:
- O senhor terminou de migrar todas as tabelas registradas no metastore legado para Unity Catalog, ou sempre usou Unity Catalog e nunca o legado Hive metastore.
- Você quer forçar seus usuários a parar de usar tabelas registradas no metastore legado.
- O senhor atualizou todos os trabalhos para Databricks Runtime 13.3 LTS ou acima.
- Um account Unity Catalogadministrador do ativou o: Disable Legacy recurso na account página Previews do console.
O que acontece quando você desativa o metastore legado?
Depois de desativar o metastore legado:
-
Qualquer trabalho executado em tabelas registradas no site Hive metastore falhará.
-
O fallback está desativado.
-
Os trabalhos que forem executados em Databricks Runtime versões abaixo de 13.3 falharão.
O trabalho em execução no momento continuará funcionando até ser encerrado, mas as reinicializações nesses clusters falharão.
-
O título Legacy e o catálogo
hive_metastore
desaparecem do painel do navegador Catalog Explorer. -
SQL O comando que tentar mostrar o conteúdo do catálogo
hive_metastore
falhará.
A desativação do acesso legado não impede que os usuários usem credenciais no nível do cluster, como entidade de serviço, que estão disponíveis em um cluster. Databricks recomenda que o senhor remova essas credenciais do seu clustering.
Não O clustering compartilhado de isolamento não respeita a configuração de desativação do legado Hive metastore. Para impedir que os usuários criem e usem esse clustering, ative a configuração Enforce User Isolation para o site workspace. Consulte Aplicar tipos de clustering de isolamento de usuário em um workspace.
Desativar todo o acesso direto ao Hive metastore
Desative o acesso legado do seu workspace Hive metastore usando a configuração Disable legacy access workspace admin:
-
Como administrador do workspace, faça logon no seu workspace Databricks.
-
Clique no menu do perfil do usuário no canto superior direito e selecione Configurações no menu.
-
Acesse o workspace admin > Security .
-
Defina Disable legacy access (Desativar acesso legado ) como Disabled (Desativado): o recurso de acesso legado não pode ser usado .
Se essa configuração estiver ausente, peça a um administrador do account para ativar a configuração Previews > Unity Catalog: Disable Legacy recurso no console account.
-
Para garantir que a nova configuração tenha entrado em vigor, aguarde aproximadamente cinco minutos.
-
Reinicie todos os clusters em execução.
Desativar o acesso para compute clustering individual
O senhor pode desativar o acesso direto gradualmente, com base em cada cluster. Ignore as etapas da seção anterior e defina a seguinte configuração Spark em qualquer clustering que não sejaserverless:
spark.databricks.unityCatalogOnlyMode True
Essa abordagem pode ser útil durante uma migração para o site Unity Catalog quando o senhor deseja reduzir a dependência do Hive metastore de forma incremental até que possa desativá-lo para todo o workspace.
Consulte Configuração do Spark.