Pular para o conteúdo principal

Ingerir dados do Pendo

info

Beta

Este recurso está em Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Pré-visualizações . Consulte Gerenciar prévias do Databricks.

Esta página mostra como criar um pipeline de ingestão Pendo gerenciado usando LakeFlow Connect.

Requisitos

  • Para criar um pipeline de ingestão, você deve primeiro atender aos seguintes requisitos:

    • Seu workspace deve estar habilitado para o Unity Catalog.

    • O compute serverless deve ser habilitado para seu workspace. Consulte Requisitos de computação serverless.

    • Para criar uma nova conexão, é preciso ter os privilégios CREATE CONNECTION no metastore. Consulte Gerenciar privilégios no Unity Catalog.

      Se o conector suportar a criação de pipelines baseada na IU, um administrador poderá criar a conexão e o pipeline simultaneamente, ao concluir os passos nesta página. No entanto, se os usuários que criam pipelines usam a autoria de pipeline baseada em API ou são usuários não administradores, um administrador deve primeiro criar a conexão no Catalog Explorer. Consulte Conectar-se a fontes de ingestão gerenciadas.

    • Para usar uma conexão existente: é preciso ter os privilégios USE CONNECTION ou ALL PRIVILEGES no objeto de conexão.

    • Você deve ter privilégios USE CATALOG no catálogo de destino.

    • É necessário ter os privilégios USE SCHEMA e CREATE TABLE em um esquema existente ou os privilégios CREATE SCHEMA no catálogo de destino.

  • Para ingerir do Pendo, é preciso primeiro configurar a autenticação do Databricks. Consulte Configurar Pendo para ingestão gerenciada.

Criar pipeline de ingestão

  1. Na barra lateral do workspace do Databricks, clique em Ingestão de dados .
  2. Na página **Adicionar dados**, em **Conectores do Databricks**, clique em **Pendo**.
  3. Na página Conexão do assistente de ingestão, selecione a conexão que armazena suas credenciais de acesso Pendo. Se você tem o privilégio CREATE CONNECTION no metastore, você pode clicar em Ícone de mais. Criar conexão para criar uma nova conexão com os detalhes de autenticação em Criar uma conexão Pendo.
  4. Clique em Avançar .
  5. Na página de Configuração de Ingestão , insira um nome exclusivo para o pipeline.
  6. Selecione um catálogo e um esquema onde os logs de eventos serão gravados. Se houver os privilégios USE CATALOG e CREATE SCHEMA no catálogo, pode-se clicar em Ícone de mais. Criar esquema no menu suspenso para criar um novo esquema.
  7. Clique em **Criar pipeline e continuar**.
  8. Na **Página de Origem**, selecione as tabelas para ingestão.
  9. Clique em Salvar e continuar .
  10. Na página Destino , selecione um catálogo e um esquema para carregar dados. Se houver os privilégios USE CATALOG e CREATE SCHEMA no catálogo, pode-se clicar em Ícone de mais. Criar esquema no menu suspenso para criar um novo esquema.
  11. Clique em Salvar e continuar .
  12. (Opcional) Na página Cronogramas e notificações , clique em Ícone de mais. Crie um agendamento . Defina a frequência para fazer o refresh das tabelas de destino.
  13. (Opcional) Clique em Ícone de mais. Adicionar notificação para configurar notificações por email para sucesso ou falha da operação do pipeline e, em seguida, clique em Salvar e executar pipeline .

Exemplos

Use estes exemplos para configurar seu pipeline.

Ingerir o esquema inteiro

O arquivo de definição de pipeline a seguir ingere todas as tabelas Pendo compatíveis em um esquema de destino:

YAML
resources:
pipelines:
pendo_pipeline:
name: pendo_pipeline
catalog: 'main'
target: 'pendo_data'
ingestion_definition:
connection_name: pendo_connection
objects:
- schema:
source_schema: 'default'
destination_catalog: 'main'
destination_schema: 'pendo_data'

Ingerir tabelas específicas

Ingerir tabelas individuais do Pendo. Para uma lista completa de tabelas suportadas, consulte tabelas de origem suportadas.

O seguinte arquivo de definição de pipeline ingere tabelas Pendo individuais.

YAML
resources:
pipelines:
pendo_pipeline:
name: pendo_pipeline
catalog: 'main'
target: 'pendo_data'
ingestion_definition:
connection_name: pendo_connection
objects:
- table:
source_schema: 'default'
source_table: 'page'
destination_catalog: 'main'
destination_schema: 'pendo_data'
destination_table: 'page'
- table:
source_schema: 'default'
source_table: 'feature'
destination_catalog: 'main'
destination_schema: 'pendo_data'
destination_table: 'feature'
- table:
source_schema: 'default'
source_table: 'guide'
destination_catalog: 'main'
destination_schema: 'pendo_data'
destination_table: 'guide'
- table:
source_schema: 'default'
source_table: 'report'
destination_catalog: 'main'
destination_schema: 'pendo_data'
destination_table: 'report'

Arquivo de definição de Job de Pacotes de Automação Declarativa

YAML
resources:
jobs:
pendo_job:
name: pendo_job
schedule:
quartz_cron_expression: '0 0 0 * * ?'
timezone_id: 'UTC'
tasks:
- task_key: pendo_ingestion
pipeline_task:
pipeline_id: ${resources.pipelines.pendo_pipeline.id}

Padrões comuns

Para configurações avançadas de pipeline, consulte Padrões comuns para pipelines de ingestão gerenciados.

Passos seguintes

Iniciar, programar e definir alertas no seu pipeline. Veja Tarefas comuns de manutenção de pipelines.

Recursos adicionais