Pular para o conteúdo principal

Consultar percepções de desempenho

info

Visualização

Este recurso está em Visualização Privada. Para experimentar, entre em contato com seu contato da Databricks.

Na execução das consultas, Databricks pode retornar percepções que identificam oportunidades para melhorar o desempenho. Esta página lista as percepções suportadas e seus significados.

Para uma visão geral mais ampla das melhores práticas de desempenho, revise o guia abrangente para otimizar cargas de trabalho Databricks, Spark e Delta Lake.

ESCRITA CONCORRENTE

  • Escritas simultâneas na tabela causam conflitos que são resolvidos automaticamente ou falham.
  • Recomendação : Analise o histórico de alterações para identificar gravações concorrentes e considere diferentes programações para evitar conflitos.

AGRUPAMENTO DE CHAVES DE FILTRO DE COBERTURA

  • A tabela é agrupada por uma ou mais chaves que não são usadas na filtragem durante a varredura da tabela.
  • Recomendação : Determine qual subconjunto de dados você precisa para o resultado desejado e, em seguida, adicione filtros com base na chave clustering correspondente para reduzir a quantidade de bytes lidos.

PARTICIONAMENTO_DE_CHAVES_DE_FILTRO_DE_COBERTURA

  • A tabela é particionada por uma ou mais chaves que não são usadas na filtragem durante a varredura da tabela.
  • Recomendação : Determine qual subconjunto de dados você precisa para o resultado desejado e, em seguida, adicione filtros com base na chave de particionamento correspondente para reduzir a quantidade de bytes lidos.

COBERTURA_FÓTON

  • Photon não consegue acelerar as operações, então o mecanismo de tempo de execução padrão foi usado.
  • Recomendação : revise as limitações do Photon e considere ajustar a consulta para usar uma estratégia de execução compatível para um tempo de execução mais rápido.

ESTATÍSTICAS_DE_COBERTURA_DELTA

  • As estatísticas de omissão de dadosDelta estão ausentes ou incompletas para os filtros de arquivo de varredura de tabela, portanto, a consulta usa filtragem no arquivo. Os seguintes status estatísticos são possíveis:

    • Completo : Estatísticas disponíveis para todos os filtros.
    • Parcial : As estatísticas estão disponíveis para um subconjunto de filtros.
    • Indisponível : As estatísticas não estão disponíveis para nenhum filtro.
    • Não utilizado : As estatísticas não puderam ser usadas em um filtro que converte o tipo de dados.
  • Recomendação : colete estatísticas Delta para reduzir o número de bytes lidos.

OTIMIZADOR_DE_ESTATÍSTICAS_DE_COBERTURA

DADOS_DISCUSSÃO

VAZAMENTO DE DADOS

  • Ocorreu um vazamento de dados para o disco durante a execução de um operador porque o tamanho dos dados não cabia na memória.
  • Recomendação : Aumente o tamanho do armazém para aumentar a memória disponível. Reduza o número de linhas, o número de colunas ou o tamanho de colunas grandes (strings, arrays, mapas, structs) para diminuir o uso de memória.

TEMPO_DE_FILA_EXCESSIVO

JUNÇÃO_EXPLOSIVA

FLUXO_COMPLETO_RECOMPUTADO

IO_THROTTLING

  • A sua solicitação de armazenamento em nuvem foi limitada pelo seu provedor cloud .
  • Recomendação : Entre em contato com seu administrador para aumentar seus limites de solicitação de armazenamento cloud junto ao seu provedor cloud .

AGREGAÇÃO REDUNDANTE

JUNÇÃO_SELETIVA

  • A operação de junção está gerando um número significativamente menor de linhas do que as que foram lidas.
  • Recomendação : Determine qual subconjunto de resultados é necessário e, em seguida, adicione filtros antes da join para reduzir o número de linhas de entrada.

PROJEÇÃO_AMPLA

  • Projetando todas as colunas na tabela.
  • Recomendação : Determine qual subconjunto de resultados é necessário e, em seguida, projete apenas essas colunas para reduzir o número de bytes lidos.