Limitações do conector de ingestão do Salesforce
Este artigo lista as limitações e considerações sobre a ingestão de dados do Salesforce usando Databricks LakeFlow Connect.
Limitações gerais do conector SaaS
As limitações desta seção se aplicam a todos os conectores SaaS em LakeFlow Connect.
- Quando o senhor executa um pipeline agendado, o alerta não é acionado imediatamente. Em vez disso, eles são acionados quando a próxima atualização é executada.
- Quando uma tabela de origem é excluída, a tabela de destino não é excluída automaticamente. Você deve excluir a tabela de destino manualmente. Esse comportamento não é consistente com o comportamento da DLT.
- Durante os períodos de manutenção da fonte, a Databricks pode não conseguir acessar seus dados.
- Se um nome de tabela de origem entrar em conflito com um nome de tabela de destino existente, a atualização do pipeline falhará.
- O suporte a pipeline de vários destinos é somente de API.
- Opcionalmente, você pode renomear uma tabela que você ingere. Se o senhor renomear uma tabela no pipeline, ela se tornará um pipeline somente de API e não será mais possível editar o pipeline na interface do usuário.
- A seleção e a desseleção em nível de coluna são somente para API.
- Se o senhor selecionar uma coluna depois que um pipeline já tiver começado, o conector não preencherá automaticamente os dados da nova coluna. Para ingerir dados históricos, o senhor deve executar manualmente um refresh completo na tabela.
- O pipeline de ingestão gerenciar não é compatível com o seguinte:
- espaço de trabalho em AWS GovCloud regiões
- espaço de trabalho em Azure GovCloud regiões
- Espaço de trabalho em conformidade com o FedRAMP
Limitações específicas do conector
As limitações desta seção são específicas do conector de ingestão do Salesforce.
Autenticação
- O Salesforce permite que o senhor gire um refresh tokens, mas o conector não é compatível com isso.
Tipos de dados
- Os dados do Salesforce do tipo
NUMBER
eCURRENCY
perdem três dígitos de precisão quando ingeridos. Esses valores podem ter 18 dígitos antes da vírgula decimal no Salesforce, mas só têm 15 dígitos antes da vírgula decimal no Databricks.
tubulação
- Há um máximo de 250 objetos por pipeline. No entanto, não há limite para o número de linhas ou colunas suportadas nesses objetos.
base64
, os tiposaddress
,location
oucomplexValue
não são suportados. Essas colunas são eliminadas automaticamente durante a ingestão.- O Databricks pode ingerir campos de fórmula. No entanto, o site Databricks exige um Snapshot completo desses campos. Isso significa que a latência do pipeline depende do fato de seus dados do Salesforce incluírem campos de fórmula e do volume de atualizações em seus dados do Salesforce.
- Databricks campos de fórmula de execução na mesma cadência que o restante do pipeline. No entanto, dentro da cadência de atualizações do pipeline, os campos sem fórmula podem ser atualizados antes dos campos com fórmula.
evolução do esquema
-
O Databricks trata as exclusões flexíveis da mesma forma que as inserções e atualizações. Quando uma linha é excluída do Salesforce, ela é excluída da tabela bronze na próxima sincronização dos dados. Por exemplo, suponha que o senhor tenha um pipeline sendo executado de hora em hora. Se você sincronizar às 12h e tiver um registro excluído às 12h30, a exclusão não será refletida até que a sincronização às 13h ocorra.
Há um caso extremo: Se o pipeline não tiver sido executado depois que os registros foram excluídos, mas antes de serem removidos da lixeira do Salesforce, o Databricks perderá essas exclusões. A única maneira de se recuperar disso é com um refresh completo.
-
O Databricks não oferece suporte a exclusões rígidas automaticamente. O senhor deve acessar refresh a tabela de destino para refletir essas informações.
-
O SCD tipo 2 não é compatível.
Tabelas
A seguir está uma lista não exaustiva de objetos do Salesforce não suportados:
-
Objetos com cláusulas
WHERE
ou restriçõesLIMIT
:Announcement
AppTabMember
CollaborationGroupRecord
ColorDefinition
ContentDocumentLink
ContentFolderItem
ContentFolderMember
DataStatistics
DatacloudDandBCompany
EntityParticle
FieldDefinition
FieldHistoryArchive
FlexQueueItem
FlowVariableView
FlowVersionView
IconDefinition
IdeaComment
NetworkUserHistoryRecent
OwnerChangeOptionInfo
PicklistValueInfo
PlatformAction
RelationshipDomain
RelationshipInfo
SearchLayout
SiteDetail
TaskWhoRelation
UserEntityAccess
UserFieldAccess
Vote
-
Objetos para monitoramento de eventos em tempo real:
ApiEvent
BulkApiResultEventStore
EmbeddedServiceDetail
EmbeddedServiceLabel
FormulaFunction
FormulaFunctionAllowedType
FormulaFunctionCategory
IdentityProviderEventStore
IdentityVerificationEvent
LightningUriEvent
ListViewEvent
LoginAsEvent
LoginEvent
LogoutEvent
Publisher
RecordActionHistory
ReportEvent
TabDefinition
UriEvent
-
Objetos que terminam com
__b
,__x
ou__hd
:ActivityMetric
ActivityMetricRollup
Site