Pular para o conteúdo principal

Conector de ingestão do Salesforce

Databricks LakeFlow Connect fornece um conector integrado para ingestão de dados diretamente da plataforma Salesforce para Databricks. As equipes de dados podem facilmente construir pipelines eficientes e incrementais em escala, e as empresas podem obter insights valiosos unificando todos os seus dados e AI ativos na Plataforma de Inteligência de Dados.

Uma organização pode querer usar dados do Salesforce para prever a rotatividade de clientes. O vídeo a seguir demonstra como um varejista pode fazer isso, coletando os dados de pedidos de seus clientes, analisando-os e combinando-os com as interações dos clientes em outros canais para obter uma view holística do cliente.

Disponibilidade do recurso

Recurso

Disponibilidade

Criação pipeline baseada em interface de usuário

Ícone de visto verde Apoiado

Criação pipeline baseada em API

Ícone de visto verde Apoiado

Pacotes de Automação Declarativa

Ícone de visto verde Apoiado

Ingestão incremental

Ícone de visto verde Apoiado

Por default, os campos de fórmula exigem um Snapshot completo. Para habilitar a ingestão incremental de campos de fórmula, consulte Ingerir campos de fórmula do Salesforce incrementalmente.

Governança Unity Catalog

Ícone de visto verde Apoiado

orquestração usando Databricks Workflows

Ícone de visto verde Apoiado

SCD tipo 2

Ícone de visto verde Apoiado

Seleção e deseleção de colunas baseadas em API

Ícone de visto verde Apoiado

Filtragem de linhas baseada em API

Ícone de visto verde Apoiado

Evolução automatizada do esquema: Colunas novas e excluídas

Ícone de visto verde Apoiado

Evolução automatizada do esquema: mudanças no tipo de dados

Ícone X vermelho Não suportado

Evolução automatizada do esquema: renomeação de colunas

Ícone de visto verde Apoiado

Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo).

Evolução automatizada do esquema: Novas tabelas

N/A

Número máximo de tabelas por pipeline

250

Métodos de autenticação

Método de autenticação

Disponibilidade

OAuth U2M

Ícone de visto verde Apoiado

OAuth M2M

Ícone X vermelho Não suportado

OAuth (tokens refresh manual)

Ícone X vermelho Não suportado

Autenticação básica (nome de usuário/senha)

Ícone X vermelho Não suportado

Autenticação básica ( key API )

Ícone X vermelho Não suportado

Autenticação básica ( key JSON da account )

Ícone X vermelho Não suportado

O que você precisa saber antes de começar.

tópico

Por que isso importa

Perfil do usuário do Databricks

O fluxo de trabalho depende do seu perfil de usuário do Databricks:

  • Usuário único: Um usuário administrador cria uma conexão com Unity Catalog e um pipeline de ingestão.
  • Multiusuário: Um usuário administrador cria uma conexão para que usuários sem privilégios de administrador possam criar pipelines.

Método de autenticação

Os passos para criar uma conexão dependem do método de autenticação escolhido.

Interface

Os passos para criar um pipeline dependem da interface.

Frequência de ingestão

A programação pipeline depende dos seus requisitos de latência e custo.

Padrões comuns

Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de história, seleção de coluna e filtragem de linha. As configurações suportadas variam de acordo com o conector. Consulte a disponibilidade do recurso.

começar a ingerir do Salesforce

A tabela a seguir fornece uma visão geral do fluxo de ingestão do Salesforce de ponta a ponta, com base no tipo de usuário:

Usuário

os passos

Administrador

Qualquer:

  • Use o Catalog Explorer para criar uma conexão com o Salesforce, permitindo que usuários sem privilégios de administrador criem pipelines. Consulte a Salesforce.
  • Utilize a interface de ingestão de dados para criar uma conexão e um pipeline simultaneamente. Consulte Ingerir dados do Salesforce.

Não administrativo

Utilize qualquer interface compatível para criar um pipeline a partir de uma conexão existente. Consulte Ingerir dados do Salesforce.