メインコンテンツまでスキップ

Power BI チートシート

このページでは、Power BI と Databricks でデータを効率的に管理して、クエリ パフォーマンスを最適化し、効率的なダッシュボードを作成するための明確で説得力のあるガイダンスを提供します。

DatabricksとPower BIを接続する

ベストプラクティス

インパクト

ドキュメント

異なるDatabricks環境に接続する場合はPower BIを使用する

異なる Databricks ワークスペースまたは異なる Databricks SQL ウェアハウスに接続するときに柔軟性を実現します。

Databricks の Power BI サービスへの公開機能を使用する

Databricks UI を離れることなく、シームレスなカタログ統合とデータ モデルの同期を可能にします。

Databricks Automatic Publishing を Power BI に使用

データパイプラインからUnity CatalogのデータセットをPower BIに直接発行します。

-ジョブの Power BI タスク

最も適切な保管モードを選択する

ベストプラクティス

インパクト

ドキュメント

ファクト テーブルには DirectQuery を使用し、ディメンション テーブルには Dual を使用します (インポートではありません)

最も適切なストレージ モードを使用して、より効率的な SQL クエリを生成します。

可能な限り、インポートよりも DirectQuery を優先する

ガバナンスと可聴性を維持できます。

混合ストレージモードには複合モデルを使用する

DirectQuery、デュアル、インポート モード テーブル、集計テーブル、ハイブリッド テーブルの混在使用を許可します。

集計されたヒストリカルデータと保留データのハイブリッド テーブルを使用する

効率的なメモリ内クエリを有効にします。

-ハイブリッドテーブル

データアクセスを最適化する

ベストプラクティス

インパクト

ドキュメント

ユーザー定義集計を使用する

事前に集計されたデータをキャッシュすることにより、大規模な DirectQuery セマンティック モデルでのクエリ パフォーマンスが向上します。

-ユーザー定義集計 -機能設定チュートリアル

自動集計を使用する

レポートのパフォーマンスを最大化するために、書き込みー履歴に基づいて集計を構築することで、DirectQuery セマンティック モデルを継続的に最適化します。

-自動集計 -機能設定チュートリアル

テーブルパーティションまたは増分更新を使用する

特に非常に小さく、静的で、パフォーマンスに敏感な (2 秒未満) レポートの場合、データのインポートを高速化し、大規模なデータセットを管理できます。

-表形式モデルのパーティション -増分更新 -機能設定チュートリアル

すべてのスライサーを適用 および すべてのスライサーをクリアする ボタンを追加します。

ユーザーがレポート フィルターを操作するときにクエリ削減設定を活用して、不要なクエリを防止します。

-すべてのスライサーを適用およびすべてのスライサーをクリアするボタン

上流の取り込みで 参照整合性が検証されている場合は、テーブル関係を定義するときに「参照整合性を想定」を 使用します。

SQL クエリでより効率的な結合戦略を有効にします。

-参照整合性を仮定する

データモデルを微調整する

ベストプラクティス

インパクト

ドキュメント

「左に移動」変換

SQL ビューは Databricks SQL エンジンのパワーを活用して、PowerQuery 変換や DAX 数式に比べてより効率的なレポート実行を実現します。

-ビューとは何ですか? -機能設定チュートリアル

DAX 数式を使用する必要がある場合は、DAX 数式を最適化し、結果セットが大きくならないようにしてください。

パフォーマンスの低下につながる非効率的な計算を防止します

-モデルのパフォーマンスを向上させるためのベストプラクティス

セマンティックモデルではDAXの計算列と計算テーブルの使用を避け、このデータをゴールドテーブルで直接定義します。

事前計算されたメジャーはゴールドレイヤーで最高のパフォーマンスを発揮します

-ゴールドレイヤーによるパワーアナリティクス

DirectQueryの場合は、クエリの並列化構成設定を確認します。

クエリの並列化が向上し、 SQLウェアハウスの利用率が最大化されて、全体的なパフォーマンスが向上します。

-ダイレクトクエリモードのクエリ並列化 -機能設定チュートリアル

DirectQuery の場合、Power BI が Databricks に並列に送信できるクエリの数を確認します。

クエリがキューに入れられてレポートが遅くなることを回避するために、必要なレベルの並列処理を処理できるように Databricks SQL ウェアハウスのサイズが適切に設定されていることを確認します。

-サーバレスSQLウェアハウスのサイジング

パフォーマンスとメトリクスを監視する

ベストプラクティス

インパクト

ドキュメント

Power BI パフォーマンス アナライザーを使用してレポート要素のパフォーマンスを調べる

読み込みに最も時間がかかる視覚化とボトルネックとなっている場所を特定します。

-パフォーマンスアナライザーを使用する

Power BI セマンティック モデルの次のプロパティを評価します。 - データソースあたりの最大接続数 - 同時評価の最大数 - 並列ジョブの最大数 - クエリあたりの最大並列処理数

モデルのパフォーマンスを微調整します。

-最大接続数 -評価構成設定 -データセットのパフォーマンス向上のためのクエリ並列化