Pular para o conteúdo principal

Ingerir dados do Monday.com

info

Beta

Este recurso está em Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Pré-visualizações . Consulte Gerenciar prévias do Databricks.

Esta página mostra como criar um pipeline de ingestão gerenciado do Monday.com usando o LakeFlow Connect.

Requisitos

  • Para criar um pipeline de ingestão, primeiro atenda aos seguintes requisitos:

    • Seu workspace deve estar habilitado para o Unity Catalog.

    • O compute serverless deve ser habilitado para seu workspace. Consulte Requisitos de computação serverless.

    • Para criar uma nova conexão, é preciso ter os privilégios CREATE CONNECTION no metastore. Consulte Gerenciar privilégios no Unity Catalog.

      Se o conector suportar a criação de pipelines baseada na IU, um administrador poderá criar a conexão e o pipeline simultaneamente, ao concluir os passos nesta página. No entanto, se os usuários que criam pipelines usam a autoria de pipeline baseada em API ou são usuários não administradores, um administrador deve primeiro criar a conexão no Catalog Explorer. Consulte Conectar-se a fontes de ingestão gerenciadas.

    • Para usar uma conexão existente: é preciso ter os privilégios USE CONNECTION ou ALL PRIVILEGES no objeto de conexão.

    • Você deve ter privilégios USE CATALOG no catálogo de destino.

    • É necessário ter os privilégios USE SCHEMA e CREATE TABLE em um esquema existente ou os privilégios CREATE SCHEMA no catálogo de destino.

  • Para ingerir dados do Monday.com, primeiro configure a autenticação do Databricks e crie uma conexão. Consulte Configure a autenticação para Monday.com e Crie uma conexão com Monday.com.

Criar pipeline de ingestão

Para obter a lista de tabelas de origem compatíveis, consulte Tabelas de origem compatíveis.

  1. Na barra lateral do workspace do Databricks, clique em Ingestão de dados .
  2. Na página **Adicionar dados**, em **Conectores Databricks**, clique em **Monday.com**.
  3. Na página Conexão do assistente de ingestão, selecione a conexão que armazena suas credenciais do Monday.com. Se você tem o privilégio CREATE CONNECTION no metastore, clique em Ícone de mais. Criar conexão para criar uma conexão com as credenciais de Configurar autenticação para Monday.com.
  4. Clique em Avançar .
  5. Na página de **Configuração de ingestão**, insira um nome para o pipeline.
  6. Selecione um catálogo e um esquema onde os logs de eventos serão gravados. Se você tiver os privilégios USE CATALOG e CREATE SCHEMA no catálogo, clique em Ícone de mais. Criar Esquema no menu suspenso para criar um esquema.
  7. Clique em **Criar pipeline e continuar**.
  8. Na **Página de Origem**, selecione as tabelas para ingestão.
  9. Clique em Salvar e continuar .
  10. Na página Destino , selecione um catálogo e um esquema para carregar dados. Se você tiver os privilégios USE CATALOG e CREATE SCHEMA no catálogo, clique em Ícone de mais. Criar esquema no menu suspenso para criar um esquema.
  11. Clique em Salvar e continuar .
  12. (Opcional) Na página Cronogramas e notificações , clique em Ícone de mais. Crie um agendamento . Defina a frequência para fazer o refresh das tabelas de destino.
  13. (Opcional) Clique em Ícone de mais. Adicionar notificação para configurar notificações por email para sucesso ou falha da operação do pipeline e, em seguida, clique em Salvar e executar pipeline .

Exemplos

O conector Monday.com disponibiliza 7 tabelas de origem no esquema de origem default. Ingerir tabelas individuais ou o esquema inteiro.

Ingerir tabelas específicas

Use esta opção para ingerir um subconjunto específico de tabelas, ou para personalizar a nomenclatura de destino por tabela.

O seguinte arquivo de definição de pipeline ingere tabelas individuais do Monday.com:

YAML
resources:
pipelines:
monday_com_pipeline:
name: monday_com_pipeline
catalog: 'main'
target: 'monday_com_data'
ingestion_definition:
connection_name: monday_com_connection
objects:
- table:
source_schema: 'default'
source_table: 'boards'
destination_catalog: 'main'
destination_schema: 'monday_com_data'
destination_table: 'boards'
- table:
source_schema: 'default'
source_table: 'activity_logs'
destination_catalog: 'main'
destination_schema: 'monday_com_data'
destination_table: 'activity_logs'
- table:
source_schema: 'default'
source_table: 'users'
destination_catalog: 'main'
destination_schema: 'monday_com_data'
destination_table: 'users'

Ingerir o esquema inteiro

Use esta opção para ingerir todas as tabelas de origem do Monday.com em um único esquema de destino com uma única declaração.

O seguinte arquivo de definição de pipeline ingere todas as tabelas compatíveis do Monday.com em um esquema de destino:

YAML
resources:
pipelines:
monday_com_pipeline:
name: monday_com_pipeline
catalog: 'main'
target: 'monday_com_data'
ingestion_definition:
connection_name: monday_com_connection
objects:
- schema:
source_schema: 'default'
destination_catalog: 'main'
destination_schema: 'monday_com_data'

Arquivo de definição de Job de Pacotes de Automação Declarativa

O seguinte é um exemplo de arquivo de definição de job para uso com Pacotes de Automação Declarativa. O Job é executado diariamente.

YAML
resources:
jobs:
monday_com_job:
name: monday_com_job
schedule:
quartz_cron_expression: '0 0 0 * * ?'
timezone_id: 'UTC'
tasks:
- task_key: monday_com_ingestion
pipeline_task:
pipeline_id: ${resources.pipelines.monday_com_pipeline.id}

Padrões comuns

Para configurações avançadas de pipeline, consulte Padrões comuns para pipelines de ingestão gerenciados.

Passos seguintes

Iniciar, programar e definir alertas no seu pipeline. Veja Tarefas comuns de manutenção de pipelines.

Recursos adicionais