Pular para o conteúdo principal

Conector Google analítico dados brutos

O conector de gerenciamento de dados analíticos brutos do Google no LakeFlow Connect permite que você ingerir dados em nível de evento do Google analítica 4 (GA4) em Databricks usando a exportação BigQuery .

O que você precisa saber antes de começar.

tópico

Por que isso importa

Perfil do usuário do Databricks

O fluxo de trabalho depende do seu perfil de usuário do Databricks:

  • Usuário único: Um usuário administrador cria uma conexão com Unity Catalog e um pipeline de ingestão.
  • Multiusuário: Um usuário administrador cria uma conexão para que usuários sem privilégios de administrador possam criar pipelines.

Método de autenticação

Os passos para criar uma conexão dependem do método de autenticação escolhido.

Interface

Os passos para criar um pipeline dependem da interface.

Frequência de ingestão

A programação pipeline depende dos seus requisitos de latência e custo.

Padrões comuns

Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de história, seleção de coluna e filtragem de linha. As configurações suportadas variam de acordo com o conector. Consulte a disponibilidade do recurso.

começar a ingerir do Google analítica

A tabela a seguir fornece uma visão geral do fluxo completo de ingestão de dados brutos do Google Analytics, com base no tipo de usuário:

Usuário

os passos

Administrador

  1. Exporte seus dados do GA4 para o BigQuery. Consulte Configurar o Google Analytics 4 e o Google BigQuery para ingestão de Databricks.
  2. Qualquer:
    • Use o Catalog Explorer para criar uma conexão com os dados brutos do Google Analytics para que usuários sem privilégios de administrador possam criar pipelines. Veja dados brutos analíticos do Google.
    • Utilize a interface de ingestão de dados para criar uma conexão e um pipeline simultaneamente. Consulte Ingerir dados do Google analítica 4.

Não administrativo

Utilize qualquer interface compatível para criar um pipeline a partir de uma conexão existente. Consulte Ingerir dados do Google analítica 4.

Disponibilidade do recurso

Recurso

Disponibilidade

Criação pipeline baseada em interface de usuário

Ícone de visto verde Apoiado

Criação pipeline baseada em API

Ícone de visto verde Apoiado

Pacotes de Automação Declarativa

Ícone de visto verde Apoiado

Ingestão incremental

Ícone de visto verde Apoiado

Governança Unity Catalog

Ícone de visto verde Apoiado

orquestração usando Databricks Workflows

Ícone de visto verde Apoiado

SCD tipo 2

Ícone de visto verde Apoiado

Seleção e deseleção de colunas baseadas em API

Ícone de visto verde Apoiado

Filtragem de linhas baseada em API

Ícone de visto verde Apoiado

Evolução automatizada do esquema: Colunas novas e excluídas

Ícone de visto verde Apoiado

Evolução automatizada do esquema: mudanças no tipo de dados

Ícone X vermelho Não suportado

Evolução automatizada do esquema: renomeação de colunas

Ícone de visto verde Apoiado

Evolução automatizada do esquema: Novas tabelas

Ícone de visto verde Apoiado

Número máximo de tabelas por pipeline

250

Métodos de autenticação

Método de autenticação

Disponibilidade

OAuth U2M

Ícone de visto verde Apoiado

OAuth M2M

Ícone X vermelho Não suportado

OAuth (tokens refresh manual)

Ícone X vermelho Não suportado

Autenticação básica (nome de usuário/senha)

Ícone X vermelho Não suportado

Autenticação básica ( key API )

Ícone de visto verde Compatível (somente API)

Autenticação básica ( key JSON da account )

Ícone X vermelho Não suportado