Conectar-se a um local externo DBFS root (legado)
Esta página descreve como se conectar a um local externo de armazenamento raiz doDatabricks File System (DBFS. Após a conexão, o senhor pode controlar o acesso a objetos no armazenamento DBFS root usando Unity Catalog.
Embora o site Databricks recomende que os dados não sejam armazenados no armazenamento DBFS root, é possível que o seu workspace faça isso devido a práticas herdadas. Por exemplo, seu workspace-local, legado Databricks Hive metastore pode ter armazenado dados no DBFS root. Siga este guia para se conectar ao site DBFS root criando primeiro um objeto de credencial de armazenamento que permita o acesso ao site DBFS root e, em seguida, um objeto de local externo que defina o caminho para o site DBFS root. Esses objetos permitem que o senhor se conecte ao legado Hive metastore para que sua equipe possa trabalhar com as tabelas Hive metastore usando Unity Catalog. Consulte Hive metastore federation: enable Unity Catalog to govern tables registered in a Hive metastore e Enable Hive metastore federation for a legacy workspace Hive metastore .
Antes de começar
Para criar um local externo para o DBFS root, o senhor deve ter uma credencial de armazenamento definida em Unity Catalog que dê acesso ao local de armazenamento em nuvem do DBFS root. Se você ainda não tiver um, o sistema poderá criar um para você durante o processo de criação do local externo.
Requisitos de permissões :
- Você deve ter os privilégios
CREATE STORAGE CREDENTIAL
eCREATE EXTERNAL LOCATION
na metastore. Os administradores de metastore têm esses privilégios em default.
Se já existir uma credencial de armazenamento para o local de armazenamento do DBFS root, o usuário que criar o local externo não precisará do CREATE STORAGE CREDENTIAL
, mas precisará do CREATE EXTERNAL LOCATION
na credencial de armazenamento e no metastore.
-
O senhor deve ser um administrador do workspace para que o sistema crie a credencial de armazenamento para o senhor durante a criação do local externo.
O senhor não precisa ser um administrador do workspace se já existir uma credencial de armazenamento que dê acesso ao local de armazenamento DBFS root e se o senhor tiver
CREATE EXTERNAL LOCATION
na credencial de armazenamento e no metastore.
Crie o local externo
O senhor pode usar o Catalog Explorer para criar um local externo para o site DBFS root.
-
Na barra lateral, clique em
Catálogo .
-
Clique em Dados externos > e em Criar local externo .
-
Insira um nome de localização externa .
-
Para o tipo de armazenamento , selecione DBFS root .
Os campos URL e subcaminho são preenchidos com o caminho de armazenamento em nuvem para o site DBFS root.
Ao criar um local externo para o DBFS root, o senhor deve usar o subcaminho para o local DBFS root e não o caminho para o bucket inteiro. A URL e o subcaminho são pré-preenchidos com user/hive/warehouse
, que é o local de armazenamento default para tabelas Hive metastore. Se quiser um controle de acesso mais refinado aos dados em DBFS root, o senhor pode criar locais externos separados para subcaminhos em DBFS root.
-
Selecione uma credencial de armazenamento que conceda acesso ao local de armazenamento em nuvem DBFS root ou, se não houver nenhuma definida, clique em + Criar nova credencial de armazenamento .
Uma credencial de armazenamento é criada automaticamente quando você salva o local externo.
-
(Opcional) Adicione um comentário.
-
(Opcional) Clique em Advanced options (Opções avançadas ) e ative o modo fallback .
O modo fallback destina-se a cenários de migração de cargas de trabalho herdadas. Consulte Ativar o modo de fallback em locais externos.
-
Clique em Criar .
-
Acesse Permissions (Permissões ) tab para conceder permissão para usar o local externo.
- Clique em Conceder .
- Selecione usuários, grupos ou entidades de serviço no campo Principals (Princípios ) e selecione o privilégio que deseja conceder.
- Clique em Conceder .
-
(Opcional) Defina o espaço de trabalho que pode acessar esse local externo.
Por default, os usuários de qualquer workspace que use esse metastore Unity Catalog podem ter acesso aos dados nesse local. O senhor pode limitar esse acesso a um espaço de trabalho específico. Databricks recomenda limitar o acesso ao site workspace em que o DBFS root está.
Consulte Vincular um local externo a um ou mais espaços de trabalho.