Pular para o conteúdo principal

Perguntas frequentes sobre o conector do Microsoft SharePoint

info

Beta

Este recurso está em versão Beta. Os administradores do espaço de trabalho podem controlar o acesso a este recurso na página de Pré-visualizações . Veja as prévias do Gerenciador Databricks.

Esta página responde a perguntas frequentes sobre o conector Microsoft SharePoint em Databricks LakeFlow Connect.

Perguntas frequentes sobre o conector de gerenciar geral

As respostas nas perguntas frequentes sobre conectores gerenciar se aplicam a todos os conectores gerenciar em LakeFlow Connect. Continue lendo as perguntas frequentes específicas sobre conectores.

Como o conector processa as atualizações no SharePoint?

Em execuções de pipeline subsequentes, o conector reingere apenas os arquivos que foram atualizados desde a última execução. Não atualiza de forma incremental dentro desses arquivos (por exemplo, apenas os dados do Excel que foram alterados dentro de um arquivo específico).

Quais APIs o conector usa?

O conector usa o gráfico Microsoft API.

Os tokens refresh expiram?

Sim Por default, os tokens refresh expiram após 90 dias. Isso vale para todos os métodos de autenticação compatíveis.

A autenticação M2M é suportada?

Sim. O conector suporta tanto o acesso delegado (OAuth U2M) quanto o acesso exclusivo de aplicativo (OAuth M2M). Para obter instruções de configuração, consulte Configurar OAuth M2M para ingestão do SharePoint.

Quais modos de armazenamento são compatíveis?

A ingestão não estruturada (BINARYFILE) é compatível com o modo de armazenamento SCD_TYPE_1. A ingestão estruturada (CSV, JSON, XML, EXCEL e outros formatos) oferece suporte ao modo de armazenamento APPEND_ONLY. SCD tipo 2 não é atualmente compatível.

Como SCD_TYPE_1 e APPEND_ONLY são os padrões para seus respectivos tipos de formato e também as únicas opções atualmente suportadas, definir storage_mode explicitamente em table_configuration é opcional.

Quais formatos de arquivo são compatíveis?

O conector suporta a ingestão de arquivos estruturados e não estruturados:

  • Não estruturado: BINARYFILE

    • Arquivos são ingeridos como linhas com uma coluna de content além de colunas de metadados. Utilize para arquivos PDF, imagens, arquivos do Office e outros arquivos a serem processados downstream.
  • Estruturado: CSV, JSON, XML, EXCEL, PARQUET, AVRO, ORC

    • Os arquivos são analisados e cada linha do arquivo é convertida em uma linha na tabela de destino.