Pular para o conteúdo principal

Desativar o acesso ao site Hive metastore usado por seu Databricks workspace

Este artigo descreve como desativar o acesso direto ao legado Hive metastore que é usado pelo seu Databricks workspace, seja o workspace-local Hive metastore ou um Hive metastore externo, incluindo o AWS Glue. Depois de concluir a migração para Unity Catalog ou federar seu Hive metastore como um catálogo externo que é governado por Unity Catalog, é possível usar uma configuração simples do administrador do workspace para impedir que os usuários contornem o Unity Catalog e acessem as tabelas registradas no Hive metastore.

Os dados em Hive metastore não são regidos por Unity Catalog. A desativação do acesso direto ao Hive metastore é uma etapa importante no processo de migração para o Unity Catalog e garante que o senhor aproveite ao máximo a governança de dados do Unity Catalog. O senhor pode desativar o acesso direto e continuar a consultar as tabelas gerenciadas pelo seu Hive metastore, aproveitando a federação Hive metastore. O senhor pode federar tabelas Hive metastore antes ou depois de desativar o acesso direto workspace ao Hive metastore. Consulte Migração workspace de Unity Catalog um existente para aHive metastore federação e: habilite o para governar tabelas registradas em Unity Catalog Hive metastore um.

Databricks recomenda que o senhor desative o acesso direto a Hive metastore para todos os clusters e cargas de trabalho de uma só vez, mas também pode usar uma configuração Spark para desativar o acesso em cada cluster.

Antes de começar: quando você deve desativar o metastore legado?

Antes de desativar o legado Hive metastore, o senhor deve atender aos seguintes critérios:

  • O senhor terminou de migrar todas as tabelas registradas no metastore legado para Unity Catalog, ou sempre usou Unity Catalog e nunca o legado Hive metastore.
  • Você quer forçar seus usuários a parar de usar tabelas registradas no metastore legado.
  • O senhor atualizou todos os trabalhos para Databricks Runtime 13.3 LTS ou acima.
  • Um account Unity Catalogadministrador do ativou o: Disable Legacy recurso na account página Previews do console.

O que acontece quando você desativa o metastore legado?

Depois de desativar o metastore legado:

  • Qualquer trabalho executado em tabelas registradas no site Hive metastore falhará.

  • O fallback está desativado.

  • Os trabalhos que forem executados em Databricks Runtime versões abaixo de 13.3 falharão.

    O trabalho em execução no momento continuará funcionando até ser encerrado, mas as reinicializações nesses clusters falharão.

  • O título Legacy e o catálogo hive_metastore desaparecem do painel do navegador Catalog Explorer.

  • SQL O comando que tentar mostrar o conteúdo do catálogo hive_metastore falhará.

nota

A desativação do acesso legado não impede que os usuários usem credenciais no nível do cluster, como perfil de instância ou entidade de serviço, que estão disponíveis em um cluster. Databricks recomenda que o senhor remova essas credenciais do seu clustering.

Não O clustering compartilhado de isolamento não respeita a configuração de desativação do legado Hive metastore. Para impedir que os usuários criem e usem esse clustering, ative a configuração Enforce User Isolation para o site workspace. Consulte Aplicar tipos de clustering de isolamento de usuário em um workspace.

Desativar todo o acesso direto ao Hive metastore

Desative o acesso legado do seu workspace Hive metastore usando a configuração Disable legacy access workspace admin:

  1. Como administrador do workspace, faça logon no seu workspace Databricks.

  2. Clique no menu do perfil do usuário no canto superior direito e selecione Configurações no menu.

  3. Acesse o workspace admin > Security .

  4. Defina Disable legacy access (Desativar acesso legado ) como Disabled (Desativado): o recurso de acesso legado não pode ser usado .

nota

Se essa configuração estiver ausente, peça a um administrador do account para ativar a configuração Previews > Unity Catalog: Disable Legacy recurso no console account.

  1. Para garantir que a nova configuração tenha entrado em vigor, aguarde aproximadamente cinco minutos.

  2. Reinicie todos os clusters em execução.

Desativar o acesso para compute clustering individual

O senhor pode desativar o acesso direto gradualmente, com base em cada cluster. Ignore as etapas da seção anterior e defina a seguinte configuração Spark em qualquer clustering que não sejaserverless:

spark.databricks.unityCatalogOnlyMode True

Essa abordagem pode ser útil durante uma migração para o site Unity Catalog quando o senhor deseja reduzir a dependência do Hive metastore de forma incremental até que possa desativá-lo para todo o workspace.

Consulte Configuração do Spark.