Pular para o conteúdo principal

Visão geral da configuração de ingestão do SharePoint

Saiba mais sobre os métodos de autenticação compatíveis para o conector do SharePoint gerenciado no LakeFlow Connect. O conector gerenciado do SharePoint oferece suporte para a ingestão de arquivos não estruturados (como PDFs e DOCX), bem como formatos estruturados (como CSV, JSON e Excel) em tabelas Delta. Para pipelines personalizados que usam as APIs Spark e SQL com controle total sobre a análise e as transformações, consulte Ingerir arquivos do SharePoint.

info

Beta

Este recurso está em versão Beta. Os administradores do espaço de trabalho podem controlar o acesso a este recurso na página de Pré-visualizações . Veja as prévias do Gerenciador Databricks.

Escolha seu conector do SharePoint

LakeFlow Connect oferece dois conectores do SharePoint. Ambos acessam dados no SharePoint, mas diferem em seu nível de gerenciamento.

Conector

Descrição

gerenciamento do conector do SharePoint

Um conector totalmente gerenciado. Conector simples e de baixa manutenção para aplicativos empresariais que ingere dados em tabelas Delta e os mantém em sincronia com a origem.

Conector padrão do SharePoint

Crie pipelines de ingestão personalizados com SQL, PySpark ou Lakeflow Spark Declarative Pipelines usando APIs em lote e de transmissão, como read_files, spark.read, COPY INTO e Auto Loader. Oferece a flexibilidade para realizar transformações complexas durante a ingestão, ao mesmo tempo em que proporciona maior responsabilidade pelo gerenciamento e manutenção de seus pipelines.

dica

O Databricks recomenda o conector gerenciado do SharePoint para a maioria dos casos de uso.

Qual método de autenticação devo escolher?

O conector gerenciado do SharePoint oferece suporte aos seguintes métodos de autenticação:

  • OAuth U2M: Gerenciado pelo Databricks (Recomendado)

    • A Databricks gerencia o aplicativo OAuth e o refresh de tokens. Não é necessário registro de aplicativo Azure. Recomendado para a maioria dos usuários.
  • OAuth U2M: Personalizado

    • Use o seu próprio registro de aplicativo do Azure. Use quando sua organização requer controle sobre a propriedade de aplicativos ou a limitação de taxa da API.
  • OAuth M2M

    • Para pipelines de produção totalmente automatizados que executam sem interação do usuário.
  • OAuth com refreshmanual de tokens

    • Um método legado. Não é recomendado para novas implementações.

Configurar OAuth U2M: Gerenciado pela Databricks (Recomendado)

Este método não requer registro de aplicativo Azure. A Databricks gerencia a configuração do OAuth e o refresh de tokens automaticamente. Para as etapas completas de configuração, consulte Configurar OAuth U2M: gerenciado pelo Databricks para ingestão do Microsoft SharePoint.