Conector do Google Drive
Beta
Este recurso está em Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Pré-visualizações . Consulte Gerenciar prévias do Databricks.
O conector gerenciado do Google Drive no LakeFlow Connect permite ingerir arquivos do Google Drive no Databricks. Ingerir arquivos não estruturados como dados binários, analisar formatos estruturados (CSV, JSON, XML, EXCEL e muito mais) em tabelas Delta ou capturar metadados de arquivo sem carregar o conteúdo do arquivo.
Para o conector padrão do Google Drive que usa APIs do leitor Spark (read_files, spark.read, Auto Loader), consulte Ingerir arquivos do Google Drive.
O que saber antes de começar
tópico | Por que é importante |
|---|---|
O fluxo de trabalho depende da sua persona de usuário do Databricks:
| |
Os passos para criar uma conexão dependem do método de autenticação que for selecionado. | |
Os passos para criar um pipeline dependem da interface. | |
O agendamento do pipeline depende de seus requisitos de latência e custo. | |
Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de história, seleção de coluna e filtragem de linha. Configurações compatíveis variam de acordo com o conector. Consulte Disponibilidade do recurso. |
Começar a ingerir do Google Drive
A tabela a seguir apresenta uma visão geral do fluxo de ingestão de ponta a ponta do Google Drive, com base no tipo de usuário.
Usuário | os passos |
|---|---|
Administrador |
|
Não-administrador | Use qualquer interface compatível para criar um pipeline a partir de uma conexão existente. Consulte Ingerir dados do Google Drive. |
Disponibilidade de recursos
Recurso | Disponibilidade |
|---|---|
Criação de pipelines via interface do usuário |
|
Criação de pipelines baseada em API |
|
Pacotes de Automação Declarativa |
|
Ingestão incremental |
|
Governança do Unity Catalog |
|
Orquestração com o Databricks Workflows |
|
SCD tipo 2 |
|
evolução do esquema |
Configurável via |
Seleção e desseleção de colunas com base em API |
|
Filtragem de linhas baseada em API |
|
Métodos de autenticação
Método de autenticação | Disponibilidade |
|---|---|
OAuth U2M |
|
OAuth M2M |
|
OAuth (token de refresh manual) |
|
Autenticação básica (nome de usuário e senha) |
|
Autenticação básica (API key) |
|
Autenticação básica (JSON key da account de serviço) |
|