メインコンテンツまでスキップ

ブルームフィルタインデックス(非推奨)

重要

ブルームフィルタのインデックスは使用しないでください。Databricksはこの機能を非推奨とし、テーブルから既存のブルームフィルタインデックスを削除することを推奨しています。

ブルームフィルタインデックスは、Databricksがどのワークロードに対しても推奨しなくなった、旧式のデータスキップメカニズムです。それらは書き込みオーバーヘッドを増加させ、調整が難しく、より効果的な代替手段に取って代わられています。

推奨される代替案

代わりに以下の機能をご利用ください。

  • 予測I/O : Databricks Runtime 12.2以降を搭載したPhoton対応のコンピュートでは、予測I/Oによりすべての列でファイルスキップが自動的に実行されます。 これは、Photonが有効になっている場合にのみ書き込みオーバーヘッドを追加するブルームフィルタインデックスを完全に置き換えるものです。
  • 液体クラスタリング : Databricks Runtime 13.3 以降では、液体クラスタリングは、頻繁にフィルター処理される列に基づいてデータを整理することで、データのスキップを改善します。

既存のブルームフィルタインデックスを削除します

テーブルに既存のブルームフィルタインデックスがある場合は、不要な書き込みオーバーヘッドを排除するためにそれらを削除してください。

SQL
DROP BLOOMFILTER INDEX ON TABLE table_name

構文の詳細については、 DROP BLOOM FILTER INDEX を参照してください。

ブルームフィルタインデックスをすべて削除した後、 vacuumを実行して、 _delta_indexディレクトリ内の基となるインデックスファイルをクリーンアップします。