ブルームフィルタインデックス（非推奨）

重要

ブルームフィルタのインデックスは使用しないでください。Databricksはこの機能を非推奨とし、テーブルから既存のブルームフィルタインデックスを削除することを推奨しています。

ブルームフィルタインデックスは、Databricksがどのワークロードに対しても推奨しなくなった、旧式のデータスキップメカニズムです。それらは書き込みオーバーヘッドを増加させ、調整が難しく、より効果的な代替手段に取って代わられています。

推奨される代替案

代わりに以下の機能をご利用ください。

予測I/O ： Databricks Runtime 12.2以降を搭載したPhoton対応のコンピュートでは、予測I/Oによりすべての列でファイルスキップが自動的に実行されます。これは、Photonが有効になっている場合にのみ書き込みオーバーヘッドを追加するブルームフィルタインデックスを完全に置き換えるものです。
液体クラスタリング : Databricks Runtime 13.3 以降では、液体クラスタリングは、頻繁にフィルター処理される列に基づいてデータを整理することで、データのスキップを改善します。

テーブルに既存のブルームフィルタインデックスがある場合は、不要な書き込みオーバーヘッドを排除するためにそれらを削除してください。

SQL
DROP BLOOMFILTER INDEX ON TABLE table_name

構文の詳細については、 DROP BLOOM FILTER INDEX を参照してください。

ブルームフィルタインデックスをすべて削除した後、 vacuumを実行して、 _delta_indexディレクトリ内の基となるインデックスファイルをクリーンアップします。