Power BI チートシート
このページでは、Power BI と Databricks でデータを効率的に管理して、クエリ パフォーマンスを最適化し、効率的なダッシュボードを作成するための明確で説得力のあるガイダンスを提供します。
DatabricksとPower BIを接続する
ベストプラクティス | インパクト | ドキュメント |
---|---|---|
異なるDatabricks環境に接続する場合はPower BIを使用する | 異なる Databricks ワークスペースまたは異なる Databricks SQL ウェアハウスに接続するときに柔軟性を実現します。 | |
Databricks の Power BI サービスへの公開機能を使用する | Databricks UI を離れることなく、シームレスなカタログ統合とデータ モデルの同期を可能にします。 | |
Databricks Automatic Publishing を Power BI に使用 | データパイプラインからUnity CatalogのデータセットをPower BIに直接発行します。 |
最も適切な保管モードを選択する
ベストプラクティス | インパクト | ドキュメント |
---|---|---|
ファクト テーブルには DirectQuery を使用し、ディメンション テーブルには Dual を使用します (インポートではありません) | 最も適切なストレージ モードを使用して、より効率的な SQL クエリを生成します。 | |
可能な限り、インポートよりも DirectQuery を優先する | ガバナンスと可聴性を維持できます。 | |
混合ストレージモードには複合モデルを使用する | DirectQuery、デュアル、インポート モード テーブル、集計テーブル、ハイブリッド テーブルの混在使用を許可します。 | |
集計されたヒストリカルデータと保留データのハイブリッド テーブルを使用する | 効率的なメモリ内クエリを有効にします。 |
データアクセスを最適化する
ベストプラクティス | インパクト | ドキュメント |
---|---|---|
ユーザー定義集計を使用する | 事前に集計されたデータをキャッシュすることにより、大規模な DirectQuery セマンティック モデルでのクエリ パフォーマンスが向上します。 | |
自動集計を使用する | レポートのパフォーマンスを最大化するために、書き込みー履歴に基づいて集計を構築することで、DirectQuery セマンティック モデルを継続的に最適化します。 | |
テーブルパーティションまたは増分更新を使用する | 特に非常に小さく、静的で、パフォーマンスに敏感な (2 秒未満) レポートの場合、データのインポートを高速化し、大規模なデータセットを管理できます。 | |
すべてのスライサーを適用 および すべてのスライサーをクリアする ボタンを追加します。 | ユーザーがレポート フィルターを操作するときにクエリ削減設定を活用して、不要なクエリを防止します。 | |
上流の取り込みで 参照整合性が検証されている場合は、テーブル関係を定義するときに「参照整合性を想定」を 使用します。 | SQL クエリでより効率的な結合戦略を有効にします。 |
データモデルを微調整する
ベストプラクティス | インパクト | ドキュメント |
---|---|---|
「左に移動」変換 | SQL ビューは Databricks SQL エンジンのパワーを活用して、PowerQuery 変換や DAX 数式に比べてより効率的なレポート実行を実現します。 | |
DAX 数式を使用する必要がある場合は、DAX 数式を最適化し、結果セットが大きくならないようにしてください。 | パフォーマンスの低下につながる非効率的な計算を防止します | |
セマンティックモデルではDAXの計算列と計算テーブルの使用を避け、このデータをゴールドテーブルで直接定義します。 | 事前計算されたメジャーはゴールドレイヤーで最高のパフォーマンスを発揮します | |
DirectQueryの場合は、クエリの並列化構成設定を確認します。 | クエリの並列化が向上し、 SQLウェアハウスの利用率が最大化されて、全体的なパフォーマンスが向上します。 | |
DirectQuery の場合、Power BI が Databricks に並列に送信できるクエリの数を確認します。 | クエリがキューに入れられてレポートが遅くなることを回避するために、必要なレベルの並列処理を処理できるように Databricks SQL ウェアハウスのサイズが適切に設定されていることを確認します。 |
パフォーマンスとメトリクスを監視する
ベストプラクティス | インパクト | ドキュメント |
---|---|---|
Power BI パフォーマンス アナライザーを使用してレポート要素のパフォーマンスを調べる | 読み込みに最も時間がかかる視覚化とボトルネックとなっている場所を特定します。 | |
Power BI セマンティック モデルの次のプロパティを評価します。 - データソースあたりの最大接続数 - 同時評価の最大数 - 並列ジョブの最大数 - クエリあたりの最大並列処理数 | モデルのパフォーマンスを微調整します。 |