Solucionar problemas comuns de compartilhamento no Delta Sharing

As seções a seguir descrevem erros comuns que podem ocorrer quando o usuário tenta acessar dados em um compartilhamento.

erros de limite de recurso excedido

Problema: Sua consulta em uma tabela compartilhada retorna o erro RESOURCE_LIMIT_EXCEEDED.

O senhor pode ver um dos seguintes erros:

  • "RESOURCE_LIMIT_EXCEEDED","message":"The table metadata size exceeded limits"

  • "RESOURCE_LIMIT_EXCEEDED","message":"The number of files in the table to return exceeded limits, consider contact your provider to optimize the table"

Possíveis causas: Há limites para o número de arquivos em metadados permitidos para uma tabela compartilhada.

Correção recomendada: Para saber como resolver um desses problemas, consulte Erro de recurso ao consultar uma tabela Delta Sharing na Base de dados de conhecimento Databricks.

Problema com o nome do bucket do AWS S3

Problema: O senhor vê uma mensagem de erro que lança uma exceção de arquivo não encontrado ou de certificado.

Exemplo de erro do Spark:

FileReadException: Error while reading file delta-sharing:/%252Ftmp%252Fexample.share%2523example.tpc_ds.example/XXXXXXXXXXXXX/XXXXXXXX.

Caused by: SSLPeerUnverifiedException: Certificate for - <[workspace name].cloud.databricks.com.s3.us-east-1.amazonaws.com> doesn't match any of the subject alternative names [s3.amazonaws.com, *.s3.amazonaws.com…]:

Exemplo de erro do Pandas:

FileNotFoundError(path)
FileNotFoundError: https://xxxx.xxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxx/part-00000-xxxxx-Amz-Algorithm=Axxxxxx-Amz-Date=xxxxxxxx&X-Amz-SignedHeaders=host&X-Amz-Expires=xxx&X-Amz-Credential=xxxxxxx_request&X-Amz-Signature=xxxxx

Exemplo de erro do Power BI:

DataSource.Error: The underlying connection was closed: Could not establish trust relationship for the SSL/TLS secure channel.
Details:
    https://xxxx.xxxxxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxxxx/part-00000-xxxxxxx.snappy.parquet

Possível causa: Normalmente, o senhor vê esse erro porque o nome do seu bucket usa notação de ponto ou ponto final (por exemplo, incorrect.bucket.name.notation). Essa é uma limitação do AWS. Consulte as regras de nomenclatura de buckets do AWS.

O senhor pode receber esse erro mesmo que o nome do bucket esteja formatado corretamente. Por exemplo, o senhor pode encontrar um erro SSL (SSLCertVerificationError) ao executar um código no PyCharm.

Correção recomendada: Se o nome do seu bucket usar uma notação de nomenclatura de bucket do AWS inválida, use um bucket diferente para o Unity Catalog e o Delta Sharing.

Se o seu bucket usar convenções de nomenclatura válidas e o senhor ainda encontrar um FileNotFoundError no Python, ative o registro de depuração para ajudar a isolar o problema:

import logging
logging.basicConfig(level=logging.DEBUG)

vacuum problema no arquivo de dados

Problema: O senhor vê uma mensagem de erro que lança uma exceção "404 O [caminho|key] especificado não existe".

Exemplos de erros do Spark:

java.lang.Throwable: HTTP request failed with status: HTTP/1.1 404 The specified path does not exist.

ou

HTTP request failed with status: HTTP/1.1 404 Not Found <?xml version="1.0" encoding="UTF-8"?>
<Error><Code>NoSuchKey</Code><Message>The specified key does not exist.</Message>

Possible cause: Normalmente, o senhor vê esse erro porque o arquivo de dados correspondente ao URL pré-assinado é vacuum na tabela compartilhada e o arquivo de dados pertence a uma versão histórica da tabela.

Solução alternativa: Consultar o Snapshot mais recente.