Limitações do conector Veeva Vault
Beta
Este recurso está em Beta. Os administradores de workspace podem controlar o acesso a este recurso na página **Pré-visualizações**. Consulte Gerenciar prévias do Databricks.
O conector Veeva Vault tem as seguintes limitações.
Limitações gerais
- Quando se executa um pipeline agendado, os alertas não são acionados imediatamente. Em vez disso, eles são acionados na próxima execução de atualização.
- Quando uma tabela de origem é excluída, a tabela de destino não é excluída automaticamente. É necessário excluir a tabela de destino manualmente. Este comportamento não é consistente com o comportamento dos Pipelines Declarativos Lakeflow Spark.
- Durante os períodos de manutenção da origem, o Databricks talvez não consiga acessar seus dados.
- Se o nome de uma tabela de origem entrar em conflito com o nome de uma tabela de destino existente, a atualização do pipeline falha.
- O suporte a pipeline de vários destinos está disponível apenas via API.
- Você pode, opcionalmente, renomear uma tabela que você ingere. Se você renomear uma tabela em seu pipeline, ela se tornará um pipeline somente de API, e você não poderá mais editar o pipeline na UI.
- Se uma coluna for selecionada depois que um pipeline já tiver começado, o conector não preenche automaticamente os dados para a nova coluna. Para ingerir data histórica, execute manualmente um refresh completo na tabela.
- Databricks can't ingest two or more tables with the same name in the same pipeline, even if they come from different source schemas.
- O sistema de origem assume que as colunas de cursor são monotonicamente crescentes.
- O conector ingere dados brutos sem transformações. Utilize os pipelines declarativos subsequentes do LakeFlow Spark para transformações.
Autenticação
Somente a autenticação OAuth 2.0 Machine-to-Machine (M2M) por meio de um provedor de identidade OIDC externo (Microsoft Entra ID) é compatível. A autenticação por nome de usuário e senha não é compatível.
Agendamento do pipeline
A Veeva gera arquivos incrementais a cada 15 minutos. Execuções de pipeline agendadas com mais frequência do que a cada 15 minutos não veem novos dados.
Retenção de arquivo
A Veeva retém arquivos incrementais por 10 dias e arquivos completos por 2 dias. Se um pipeline atrasar mais de 10 dias, a cadeia de arquivos incrementais é quebrada e um refresh completo é necessário.
Comportamento de full refresh
Quando uma atualização completa é acionada, o processo abrange duas atualizações de pipeline: a primeira atualização limpa o estado do arquivo em staging do volume do Unity Catalog, e o recarregamento completo dos dados ocorre na atualização subsequente.
Tipos de Dados do Campo ID
id Campos são sempre armazenados como o tipo STRING no Databricks, independentemente do tipo declarado em Veeva. Isso é necessário para que a funcionalidade de chave primária do Lakeflow Spark Declarative Pipelines funcione corretamente.
Alterações de esquema
Databricks recommends performing a full refresh after schema changes in Veeva to ensure they are visible in your destination tables.
O conector lida com as alterações de esquema da seguinte forma:
- Exclusão de campo : A coluna permanece na tabela de destino, mas todos os valores são definidos como
nulle não podem mais ser consultados. - Renomear campo : os registros existentes podem ser encontrados com o nome de campo antigo. Os novos registros criados após a renomeação aparecem com o novo nome de campo.
- Exclusão de objeto : objetos excluídos permanecem detectáveis no esquema.
- Renomeação de objeto : O nome do objeto antigo permanece no esquema. Novos registros adicionados sob o novo nome de objeto aparecem sob o novo nome de tabela.
Suporte para tabelas do sistema
A versão inicial suporta a ingestão de um conjunto fixo de __sys tabelas:
DOCUMENT_VERSIONDOCUMENT_RELATIONSHIPPICKLISTWORKFLOWWORKFLOW_ITEMWORKFLOW_TASKWORKFLOW_TASK_ITEMACTIVE_LEGACY_WORKFLOWACTIVE_LEGACY_WORKFLOW_TASKINACTIVE_LEGACY_WORKFLOWINACTIVE_LEGACY_WORKFLOW_TASK
Outras tabelas __sys não são ingeridas nesta versão. Uma versão subsequente expandirá o suporte para todas as tabelas do sistema disponíveis em seu Vault. Após essa versão, um refresh completo será necessário para ingerir as tabelas recém-suportadas.