Pular para o conteúdo principal

Índices de filtro de Bloom (obsoletos)

importante

Não utilize índices de filtro de Bloom. A Databricks descontinuou esse recurso e recomenda a remoção de quaisquer índices de filtro de Bloom existentes em suas tabelas.

Os índices de filtro de Bloom são um mecanismo legado de omissão de dados que a Databricks não recomenda mais para nenhuma carga de trabalho. Elas aumentam a sobrecarga de escrita, são difíceis de otimizar e foram substituídas por alternativas mais eficazes.

Alternativas recomendadas

Utilize o seguinte recurso em vez disso:

  • E/S preditiva : Em compute habilitada para Photon com Databricks Runtime 12.2 e superior, a E/S preditiva executa o "file skipping" em todas as colunas automaticamente. Ele substitui completamente os índices de filtro de Bloom, que apenas adicionam sobrecarga de gravação quando o Photon está ativado.
  • clusteringlíquido : No Databricks Runtime 13.3 e versões superiores, clustering líquido melhora o salto de dados, organizando-os com base em colunas filtradas com frequência.

Remover índices de filtro de Bloom existentes

Se você já possui índices de filtro de Bloom em suas tabelas, remova-os para eliminar a sobrecarga de gravação desnecessária:

SQL
DROP BLOOMFILTER INDEX ON TABLE table_name

Para detalhes de sintaxe, consulte DROP BLOOM FILTER INDEX.

Após remover todos os índices do filtro de Bloom, execute vacuum para limpar os arquivos de índice subjacentes no diretório _delta_index .