Solucionar problemas comuns de compartilhamento no Delta Sharing
As seções a seguir descrevem erros comuns que podem ocorrer quando o usuário tenta acessar dados em um compartilhamento.
Erros de limite de recurso excedido
Problema: sua query em uma tabela compartilhada retorna o erro RESOURCE_LIMIT_EXCEEDED
.
Você pode ver um destes erros:
"RESOURCE_LIMIT_EXCEEDED","message":"The table metadata size exceeded limits"
"RESOURCE_LIMIT_EXCEEDED","message":"The number of files in the table to return exceeded limits, consider contact your provider to optimize the table"
Possíveis causas: Há limites no número de arquivos em metadados permitidos para uma tabela compartilhada.
Correção recomendada: para saber como resolver qualquer um desses problemas, consulte erro de recurso ao consultar uma tabela Delta Sharing na base de dados de conhecimento do databricks.
Problema com o nome do bucket do AWS S3
Problema: você vê uma mensagem de erro que gera um arquivo não encontrado ou uma exceção de certificado.
Exemplo de erro do Spark:
FileReadException: Error while reading file delta-sharing:/%252Ftmp%252Fexample.share%2523example.tpc_ds.example/XXXXXXXXXXXXX/XXXXXXXX.
Caused by: SSLPeerUnverifiedException: Certificate for - <[workspace name].cloud.databricks.com.s3.us-east-1.amazonaws.com> doesn't match any of the subject alternative names [s3.amazonaws.com, *.s3.amazonaws.com…]:
Exemplo de erro do Pandas:
FileNotFoundError(path)
FileNotFoundError: https://xxxx.xxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxx/part-00000-xxxxx-Amz-Algorithm=Axxxxxx-Amz-Date=xxxxxxxx&X-Amz-SignedHeaders=host&X-Amz-Expires=xxx&X-Amz-Credential=xxxxxxx_request&X-Amz-Signature=xxxxx
Exemplo de erro do Power BI:
DataSource.Error: The underlying connection was closed: Could not establish trust relationship for the SSL/TLS secure channel.
Details:
https://xxxx.xxxxxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxxxx/part-00000-xxxxxxx.snappy.parquet
Possível causa: Normalmente, você vê esse erro porque o nome do seu bucket usa notação de ponto ou ponto (por exemplo, incorrect.bucket.name.notation
). Esta é uma limitação da AWS. Consulte as regras de nomenclatura de bucket da AWS.
Você pode receber esse erro mesmo se o nome do seu bucket estiver formatado corretamente. Por exemplo, você pode encontrar um erro SSL (SSLCertVerificationError
) ao executar o código no PyCharm.
Correção recomendada: Se o nome do seu bucket usar uma notação de nomenclatura de bucket do AWS inválida, use um bucket diferente para o Unity Catalog e o Delta Sharing.
Se seu bucket usa convenções de nomenclatura válidas e você ainda enfrenta um FileNotFoundError
em Python, ative o log de depuração para ajudar a isolar o problema:
import logging
logging.basicConfig(level=logging.DEBUG)
vacuum problema no arquivo de dados
Problema: O senhor vê uma mensagem de erro que lança uma exceção "404 O [caminho|key] especificado não existe".
Exemplos de erros do Spark:
java.lang.Throwable: HTTP request failed with status: HTTP/1.1 404 The specified path does not exist.
ou
HTTP request failed with status: HTTP/1.1 404 Not Found <?xml version="1.0" encoding="UTF-8"?>
<Error><Code>NoSuchKey</Code><Message>The specified key does not exist.</Message>
Possible cause: Normalmente, o senhor vê esse erro porque o arquivo de dados correspondente ao URL pré-assinado é vacuum na tabela compartilhada e o arquivo de dados pertence a uma versão histórica da tabela.
Solução alternativa: Consulte o site mais recente Snapshot.