gerenciar conector FAQs

Encontre respostas para perguntas frequentes sobre conectores de gerenciamento no Databricks LakeFlow Connect. Para perguntas frequentes específicas sobre conectores, consulte a documentação do seu conector.

Quais conectores gerenciadores o site Databricks suporta?

LakeFlow Connect oferece conectores para gerenciar o Salesforce, SQL Server, ServiceNow e Google analítica. Para informar o roteiro ou obter acesso antecipado aos conectores Private Preview, entre em contato com sua equipe account.

Quais interfaces os conectores de gerenciamento suportam?

Todos os conectores do Gerenciador suportam a criação pipeline usando APIs Databricks e Databricks Ativo Bundles. Alguns conectores também suportam a criação pipeline na interface do usuário a partir dos seguintes pontos de entrada:

A página Add data (ingestão de dados )
A página do pipeline Jobs & (Create new > Ingestion pipeline )
O painel de tarefa para um novo trabalho (Adicionar tarefa > + Nova ingestão pipeline ou Tipo > pipeline )

A tabela a seguir resume quais interfaces são suportadas por cada conector.

Conector	Criação de pipeline com base na interface do usuário	Criação de pipeline baseada em API	Databricks Asset Bundles
Salesforce
Workday
SQL Server
ServiceNow
GA4
SharePoint

Como os conectores gerenciáveis lidam com a evolução do esquema?

Todos os conectores gerenciar lidam automaticamente com colunas novas e excluídas, a menos que o senhor opte por não fazê-lo especificando explicitamente as colunas que gostaria de ingerir.

Quando uma nova coluna aparece na fonte, o Databricks a ingere automaticamente na próxima execução do pipeline. Para qualquer linha na coluna que apareceu antes da alteração do esquema, o Databricks deixa o valor vazio. No entanto, o senhor pode desativar a ingestão automatizada de colunas, listando colunas específicas a serem ingeridas por meio da API ou desativando quaisquer colunas futuras na interface do usuário.
Quando uma coluna é excluída da fonte, o Databricks não a exclui automaticamente. Em vez disso, o conector usa uma propriedade de tabela para definir a coluna excluída como “inativa” no destino. Se mais tarde aparecer outra coluna com o mesmo nome, o pipeline falhará. Nesse caso, o senhor pode acionar um refresh completo da tabela ou eliminar manualmente a coluna inativa.

Da mesma forma, os conectores podem lidar com tabelas novas e excluídas. Se o senhor ingerir um esquema inteiro, o Databricks ingerirá automaticamente todas as novas tabelas, a menos que o senhor opte por não fazê-lo. E se uma tabela for excluída na origem, o conector a definirá como inactive no destino. Observe que, se o senhor optar por ingerir um esquema inteiro, deverá analisar as limitações do número de tabelas por pipeline para o seu conector.

Alterações adicionais no esquema dependem da fonte. Por exemplo, o conector do Salesforce trata as renomeações de coluna como exclusões e adições de coluna e faz a alteração automaticamente, com o comportamento descrito acima. No entanto, o conector SQL Server exige um refresh completo das tabelas afetadas para continuar a ingestão.

A tabela a seguir resume quais alterações de esquema podem ser tratadas automaticamente por cada conector:

Conector	Renomeações de colunas	Novas tabelas
Salesforce	Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). Não requer um refresh completo.	Se você ingerir todo o esquema.
Workday	Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). Não requer um refresh completo.	Não aplicável
SQL Server	A coluna é renomeada. É necessário um refresh completo.	Se você ingerir todo o esquema.
ServiceNow	Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). Não requer um refresh completo.	Se você ingerir todo o esquema.
GA4	Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). Não requer um refresh completo.	Se você ingerir todo o esquema.
SharePoint	Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). Não requer um refresh completo.	Se você ingerir todo o esquema.

Posso personalizar os conectores gerenciar?

Você pode escolher os objetos ingeridos, o destino, o programador, as permissões, as notificações e muito mais. Não é possível personalizar o processo de ingestão em si, pois esses conectores são totalmente predefinidos. Para maior personalização, você pode usar o pipeline declarativo LakeFlow Spark ou a transmissão estruturada.

A lakehouse Federation permite que o senhor consulte fontes de dados externas sem mover seus dados. O Delta Sharing permite que o senhor compartilhe com segurança dados em tempo real entre plataformas, nuvens e regiões.

Quando o senhor puder escolher entre conectores gerenciar, lakehouse Federation e Delta Sharing, escolha Delta Sharing nos seguintes cenários:

Limitar a duplicação de dados.
Consultando os dados mais recentes possíveis.

Escolha a Lakehouse Federation para os seguintes cenários:

Relatórios ad hoc ou trabalho de prova de conceito em seu pipeline ETL.

Qual é a diferença entre gerenciar conectores e Auto Loader?

Os conectores de gerenciamento permitem que você ingira dados incrementalmente de aplicativos SaaS como o Salesforce e bancos de dados como SQL Server. Auto Loader é um conector de armazenamento de objetos cloud que permite a ingestão incremental de arquivos à medida que chegam ao S3, ADLS e GCS. É compatível com transmissão estruturada e pipeline Declarativo LakeFlow Spark , mas não oferece pipeline de ingestão totalmente gerenciado.

Os conectores gerenciar podem gravar de volta na fonte de dados?

Não. Se o senhor estiver interessado nessa funcionalidade, entre em contato com a equipe do account.

Os conectores da Gerenciar estão disponíveis em todas as regiões?

Não. Consulte disponibilidade do recurso sem servidor compute.

Um pipeline pode gravar em vários esquemas de destino?

Esse recurso é compatível com o site LakeFlow Connect API para todos os conectores do gerenciar SaaS, como Salesforce, Workday e ServiceNow.

Se o senhor optar por usar esse recurso, seu pipeline se tornará somente de API. Você não pode editá-lo na interface do usuário.

Posso alterar o nome de uma tabela que eu ingiro?

Sim, você pode definir um nome para a tabela de destino na interface do usuário do Databricks ou usando as APIs do Databricks. Consulte Nomear uma tabela de destino. Se você não definir um nome, o nome da tabela de origem será usado por default.

O que acontece se um pipeline ainda estiver em execução (atualização N) quando a próxima atualização estiver programada para ser executada (atualização N+1)?

O Databricks pula a atualização N+1 e retoma a atualização N+2, presumindo que a atualização N tenha sido concluída a tempo.

O que acontece com as tabelas de destino quando um pipeline de ingestão é excluído?

As tabelas de destino são descartadas quando o pipeline de ingestão é excluído.

Qual é o preço dos conectores gerenciar?

Os conectores gerenciar têm um modelo de preços baseado em compute.

Fontes SaaS como Salesforce e Workday, que são executadas exclusivamente em infraestrutura serverless , incorrem em cobranças DBU (Digital Business Unit) para o pipeline declarativo LakeFlow Spark serverless .

Para fontes de banco de dados como SQL Server, os gateways de ingestão podem ser executados no modo clássico ou no modo serverless , dependendo da fonte, e o pipeline de ingestão pode ser executado em serverless. Como resultado, você pode receber cobranças DBU tanto para o pipeline LakeFlow Spark Declarative clássico quanto para o pipeline DBU serverless .

Para obter detalhes sobre as tarifas, consulte a página de preços do pipeline declarativo doLakeFlow Spark.

Posso ativar o feed de dados de alteração do Delta Lake em uma tabela de destino?

Isso está ativado para todas as tabelas de destino.

Perguntas frequentes específicas sobre conectores

Para perguntas frequentes específicas sobre conectores, consulte a documentação do seu conector:

Quais conectores gerenciadores o site Databricks suporta?​

Quais interfaces os conectores de gerenciamento suportam?​

Como os conectores gerenciáveis lidam com a evolução do esquema?​

Posso personalizar os conectores gerenciar?​

Qual é a diferença entre gerenciar conectores, Lakehouse Federation e Delta Sharing?​

Qual é a diferença entre gerenciar conectores e Auto Loader?​

Os conectores gerenciar podem gravar de volta na fonte de dados?​

Os conectores da Gerenciar estão disponíveis em todas as regiões?​

Um pipeline pode gravar em vários esquemas de destino?​

Posso alterar o nome de uma tabela que eu ingiro?​

O que acontece se um pipeline ainda estiver em execução (atualização N) quando a próxima atualização estiver programada para ser executada (atualização N+1)?​

O que acontece com as tabelas de destino quando um pipeline de ingestão é excluído?​

Qual é o preço dos conectores gerenciar?​

Posso ativar o feed de dados de alteração do Delta Lake em uma tabela de destino?​

Perguntas frequentes específicas sobre conectores​