Limitações do conector do Microsoft SharePoint
Esta página lista as limitações e considerações para ingestão do Microsoft SharePoint usando Databricks LakeFlow Connect.
Limitações específicas do conector
-
Para a ingestão não estruturada (
BINARYFILE), o conector aceita somente arquivos de até 100 MB. Os metadados para arquivos maiores que 100 MB são ingeridos, mas o conteúdo do arquivo não é baixado. Não há limite de tamanho de arquivo para formatos de arquivo estruturados. -
A ingestão não estruturada (
BINARYFILE) suporta apenas o modo de armazenamentoSCD_TYPE_1. Ingestão estruturada (CSV,JSON,XML,EXCELe outros formatos) suporta apenas o modo de armazenamentoAPPEND_ONLY. SCD tipo 2 não é compatível. Ao configurar o modo de armazenamento, definastorage_modeemtable_configuration. Definir o camposcd_typegera um erro. -
O conector não suporta a seleção de arquivos individuais. Ingere todos os arquivos em uma pasta, unidade, subsítio ou site configurado.
-
O conector não oferece suporte à ingestão de listas de controle de acesso (ACLs) em nível de arquivo do SharePoint.
-
O conector não oferece suporte para ingerir arquivos vinculados a uma biblioteca de documentos do SharePoint diferente.
-
A Databricks recomenda a ingestão no máximo uma vez por hora.
-
Os utilitários fornecidos para utilização a jusante são limitados a clusters para um único usuário. No entanto, clusters de usuário único não podem acessar tabelas de transmissão criadas por outros usuários. Cada usuário a jusante deve criar seu próprio pipeline de ingestão. Você pode modificar as utilidades para fazê-las funcionar em clusters serverless e compartilhados, mas isso pode afetar o desempenho. Consulte Exemplos de acesso a arquivos.
-
Alguns campos (por exemplo,
quick_xor_hash,mime_type) não são suportados para todos os formatos de arquivo. Download de arquivos e outras ingestões de metadados continuam a funcionar nesses casos.