Índices de filtro de Bloom (obsoletos)
Não utilize índices de filtro de Bloom. A Databricks descontinuou esse recurso e recomenda a remoção de quaisquer índices de filtro de Bloom existentes em suas tabelas.
Os índices de filtro de Bloom são um mecanismo legado de omissão de dados que a Databricks não recomenda mais para nenhuma carga de trabalho. Elas aumentam a sobrecarga de escrita, são difíceis de otimizar e foram substituídas por alternativas mais eficazes.
Alternativas recomendadas
Utilize o seguinte recurso em vez disso:
- E/S preditiva : Em compute habilitada para Photon com Databricks Runtime 12.2 e superior, a E/S preditiva executa o "file skipping" em todas as colunas automaticamente. Ele substitui completamente os índices de filtro de Bloom, que apenas adicionam sobrecarga de gravação quando o Photon está ativado.
- clusteringlíquido : No Databricks Runtime 13.3 e versões superiores, clustering líquido melhora o salto de dados, organizando-os com base em colunas filtradas com frequência.
Remover índices de filtro de Bloom existentes
Se você já possui índices de filtro de Bloom em suas tabelas, remova-os para eliminar a sobrecarga de gravação desnecessária:
DROP BLOOMFILTER INDEX ON TABLE table_name
Para detalhes de sintaxe, consulte DROP BLOOM FILTER INDEX.
Após remover todos os índices do filtro de Bloom, execute vacuum para limpar os arquivos de índice subjacentes no diretório _delta_index .