クエリのパフォーマンスに関する知識
備考
プレビュー
この機能はプライベートプレビュー段階です。試すには、Databricks の担当者に問い合わせてください。
クエリを実行すると、 Databricksパフォーマンスを向上させる機会を特定する知識を返す可能性があります。 このページには、サポートされている知見とその意味がリストされています。
パフォーマンスのベスト プラクティスのより広範な概要については、 「Databricks、Spark、および Delta Lake ワークロードを最適化するための包括的なガイド」を参照してください。
COVERAGE_FILTER_KEYS_PARTITIONING
- テーブルは、テーブルスキャン中のフィルタリングに使用されない 1 つ以上のキーによってパーティション分割されています。
- 推奨事項 : 目的の結果に必要なデータ サブセットを決定し、一致するパーティション キーにフィルターを追加して、読み取られるバイト数を減らします。
カバレッジフィルターキークラスタリング
- テーブルは、テーブルスキャン中のフィルタリングに使用されない 1 つ以上のキーによってクラスター化されます。
- 推奨事項 : 目的の結果に必要なデータ サブセットを決定し、一致するクラスタリング キーにフィルターを追加して、読み取られるバイト数を減らします。
カバレッジ_フォトン
- Photon では操作を高速化できないため、標準のランタイム エンジンが使用されました。
- 推奨事項 : Photon制限を確認し、ランタイムを高速化するためにサポートされている実行戦略を使用するようにクエリを調整することを検討してください。
カバレッジ統計オプティマイザー
- コストベースのオプティマイザー統計が欠落しているか不完全であるため、クエリ プランを生成するために標準ヒューリスティックが使用されました。
- 推奨事項 : オプティマイザーがより良いプランを作成できるように統計を収集します。
カバレッジ統計差分
-
テーブル スキャン ファイル フィルターのDeltaデータ スキップ統計が欠落しているか不完全なため、クエリではファイル内フィルタリングが使用されます。 次の統計ステータスが可能です。
- 完全 : すべてのフィルターの統計が利用できます。
- 部分的 : 統計はフィルターのサブセットで利用できます。
- 利用不可 : どのフィルターでも統計は利用できません。
- 未使用 : データ型を変換するフィルターでは統計を使用できませんでした。
-
推奨事項 : 読み取られるバイト数を減らすために、 Delta 統計を収集します。