Solucionar problemas de ingestão do Microsoft SharePoint
Esta página descreve problemas comuns com o conector Microsoft SharePoint em Databricks LakeFlow Connect e como resolvê-los.
Solução de problemas gerais de pipeline
Se um pipeline falhar durante a execução, clique no passo que falhou e confirme se a mensagem de erro contém informação suficiente sobre a natureza do erro.

Verifique e baixe os logs do cluster na página de detalhes do pipeline clicando em Update details no painel à direita e, em seguida, clicando em Logs . Verifique os logs em busca de erros ou exceções.

Restringir o acesso aos arquivos do SharePoint
Para restringir os arquivos do SharePoint aos quais o conector pode acessar, crie um usuário dedicado do Microsoft Entra ID com permissões restritas do SharePoint e autentique-se no SharePoint com essa account. Como o conector utiliza acesso delegado (OAuth U2M), ele atua em nome de um usuário do Microsoft Entra ID e só pode acessar arquivos que o usuário tem permissão para visualizar.
Erros de autenticação
Se encontrar erros de OAuth, execute o seguinte código para confirmar se o seu token de refresh está funcionando como esperado:
# Fill in these values
refresh_token = ""
tenant_id = ""
client_id = ""
client_secret = ""
site_id = ""
# Get an access token
import requests
# Token endpoint
token_url = f"https://login.microsoftonline.com/{tenant_id}/oauth2/v2.0/token"
scopes = ["Sites.Read.All"]
scope = " ".join(["https://graph.microsoft.com/{}".format(s) for s in scopes])
scope += (" offline_access")
# Parameters for the request
token_params = {
"client_id": client_id,
"client_secret": client_secret,
"grant_type": "refresh_token",
"refresh_token": refresh_token,
"scope": scope
}
# Send a POST request to the token endpoint
response = requests.post(token_url, data=token_params)
response.json()
access_token = response.json().get("access_token")
# You should get an access token here. You can then check if the access token is able to list all the drives in your SharePoint site.
# List all drives
url = f"https://graph.microsoft.com/v1.0/sites/{site_id}/drives"
# Authorization header with access token
headers = {
"Authorization": f"Bearer {access_token}",
"Accept": "application/json"
}
# Send a GET request to list files with specific extensions
requests.get(url, headers=headers).json()