Configurar o Google Drive para ingestão gerenciada
Beta
Este recurso está em Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Pré-visualizações . Consulte Gerenciar prévias do Databricks.
Esta página descreve como configurar o OAuth 2.0 no Google Cloud para o conector gerenciado do Google Drive no Lakeflow Connect. Depois de concluir os passos, siga as instruções em Criar uma conexão do Google Drive para criar uma conexão do Unity Catalog.
Pré-requisitos
Antes de configurar a fonte de dados do Google Drive, você deve ter:
- Um workspace habilitado para o Unity Catalog.
- Uma conta do Google com as permissões necessárias para criar um projeto do Google Cloud.
- O privilégio
CREATE CONNECTIONno metastore, ou uma conexão existente do Google Drive compartilhada com você.
Configurar um projeto do Google Cloud e ativar a API do Google Drive
- Acesse o console do Google Cloud.
- Crie um novo projeto. A configuração da autenticação de dois fatores poderá ser solicitada.
- Acesse APIs > Serviços > Biblioteca .
- Buscar "Google Drive API".
- Selecione a API do Google Drive .
- Selecione Ativar .
Configurar a tela de consentimento OAuth
-
Na tela inicial do console do Google Cloud, acesse **APIs e Serviços > Tela de Consentimento do OAuth**. Você verá uma mensagem que diz: "Plataforma de autenticação Google ainda não configurada".
-
Selecione **Iniciar**.
-
Preencher a seção **Informações do Aplicativo**. Insira um nome para o aplicativo (por exemplo,
Databricks connection). O email de suporte pode ser qualquer email na sua organização. -
Selecione Avançar .
-
Na seção Audiência , selecione Externo e, em seguida, selecione Avançar .
-
Preencha a seção Informações de contato , depois selecione Avançar .
-
Revise a Política de dados do usuário dos serviços da API do Google e, em seguida, selecione Criar .
-
Volte para Google Auth Platform > Acesso a Dados .
-
Selecionar **Adicionar ou remover escopos**.
-
Adicione o seguinte escopo na seção Adicionar escopos manualmente , selecione Adicionar à tabela e, em seguida, selecione Atualizar :
https://www.googleapis.com/auth/drive.readonly -
Selecione Salvar .
Criar credenciais do cliente OAuth 2.0
- Na tela inicial do console do Google Cloud, vá para APIs e Serviços > Credenciais .
- Selecione **Criar Credenciais > ID do Cliente OAuth**.
- Escolha Aplicativo da web e defina um nome personalizado.
- Em URIs de redirecionamento autorizados , selecione Adicionar URI .
- Adicione uma URI de redirecionamento a
<databricks-instance-url>/login/oauth/google.html, substituindo<databricks-instance-url>pela URL da sua instância do Databricks. Por exemplo:https://instance-name.databricks.com/login/oauth/google.html - Selecione Criar . Será exibida uma caixa de diálogo com as suas credenciais.
- Registre os seguintes valores. Alternativamente, é possível fazer o download do arquivo JSON do cliente OAuth, que contém esta informação:
- ID do cliente (formato:
0123******-********************************.apps.googleusercontent.com) - Segredo do cliente (formato:
ABCD**-****************************)
- ID do cliente (formato:
Adicionar usuários de teste
- Acesse a Plataforma de Autenticação do Google > Público-alvo .
- Em Usuários de teste , selecione Adicionar usuários .
- Adicione o endereço de e-mail da conta do Google que usará para criar a conexão.
Somente compartilhe a conexão resultante do Unity Catalog com outros usuários do Databricks se a autenticação for realizada com uma serviço account. Se você se autenticar com uma account pessoal do Google, não compartilhe a conexão. O compartilhamento de uma conexão de conta pessoal concede a outros usuários acesso às credenciais e aos dados de sua conta pessoal.
Passos seguintes
Use o ID do cliente e o segredo do cliente de Criar Credenciais de Cliente OAuth 2.0 e a conta do Google de Adicionar Usuários de Teste para criar uma conexão do Unity Catalog. Consulte Criar uma conexão com o Google Drive.