メインコンテンツまでスキップ

Power BI チートシート

このページでは、Power BI と Databricks でデータを効率的に管理して、クエリパフォーマンスを最適化し、効率的なダッシュボードを作成するための明確で説得力のあるガイダンスを提供します。

Databricks で Power BI を使用するためのベストプラクティスのリファレンス実装を示す実用的なクイックスタートのセットについては、このリポジトリを参照してください。

DatabricksとPower BIを接続する

ベストプラクティス	インパクト	ドキュメント
異なるDatabricks環境に接続する場合はPower BIを使用する	異なる Databricks ワークスペースまたは異なる Databricks SQL ウェアハウスに接続するときに柔軟性を実現します。	Databricksの接続パラメーター
Databricks の Power BI サービスへの公開機能を使用する	Databricks UI を離れることなく、シームレスなカタログ統合とデータモデルの同期を可能にします。	Databricks から Power BI サービスに公開する
Databricks Automatic Publishing を Power BI に使用	データパイプラインからUnity CatalogのデータセットをPower BIに直接発行します。	-ジョブの Power BI タスク

ベストプラクティス	インパクト	ドキュメント
異なるDatabricks環境に接続する場合はPower BIを使用する	異なる Databricks ワークスペースまたは異なる Databricks SQL ウェアハウスに接続するときに柔軟性を実現します。	Databricksの接続パラメーター
Databricks の Power BI サービスへの公開機能を使用する	Databricks UI を離れることなく、シームレスなカタログ統合とデータモデルの同期を可能にします。	Databricks から Power BI サービスに公開する
Databricks Automatic Publishing を Power BI に使用	データパイプラインからUnity CatalogのデータセットをPower BIに直接発行します。	-ジョブの Power BI タスク

最も適切な保管モードを選択する

ベストプラクティス	インパクト	ドキュメント
ファクトテーブルには DirectQuery を使用し、ディメンションテーブルには Dual を使用します (インポートではありません)	最も適切なストレージモードを使用して、より効率的な SQL クエリを生成します。	Power BI Desktop でストレージモードを管理する -クイックスタート
可能な限り、インポートよりも DirectQuery を優先する	ガバナンスと可聴性を維持できます。	PowerBI の DirectQuery
混合ストレージモードには複合モデルを使用する	DirectQuery、デュアル、インポートモードテーブル、集計テーブル、ハイブリッドテーブルの混在使用を許可します。	Power BI Desktop の複合モデル
集計されたヒストリカルデータと保留データのハイブリッドテーブルを使用する	効率的なメモリ内クエリを有効にします。	-ハイブリッドテーブル

ベストプラクティス	インパクト	ドキュメント
ファクトテーブルには DirectQuery を使用し、ディメンションテーブルには Dual を使用します (インポートではありません)	最も適切なストレージモードを使用して、より効率的な SQL クエリを生成します。	Power BI Desktop でストレージモードを管理する -クイックスタート
可能な限り、インポートよりも DirectQuery を優先する	ガバナンスと可聴性を維持できます。	PowerBI の DirectQuery
混合ストレージモードには複合モデルを使用する	DirectQuery、デュアル、インポートモードテーブル、集計テーブル、ハイブリッドテーブルの混在使用を許可します。	Power BI Desktop の複合モデル
集計されたヒストリカルデータと保留データのハイブリッドテーブルを使用する	効率的なメモリ内クエリを有効にします。	-ハイブリッドテーブル

データアクセスを最適化する

ベストプラクティス	インパクト	ドキュメント
ユーザー定義集計を使用する	事前に集計されたデータをキャッシュすることにより、大規模な DirectQuery セマンティックモデルでのクエリパフォーマンスが向上します。	-ユーザー定義集計 -クイックスタート
自動集計を使用する	レポートのパフォーマンスを最大化するために、書き込みー履歴に基づいて集計を構築することで、DirectQuery セマンティックモデルを継続的に最適化します。	-自動集計 -クイックスタート
テーブルパーティションまたは増分更新を使用する	特に非常に小さく、静的で、パフォーマンスが重要となる (2 秒未満) レポートの場合、データのインポートを高速化し、大規模なデータセットを管理できます。	-表形式モデルのパーティション -増分更新 -クイックスタート
すべてのスライサーを適用およびすべてのスライサーをクリアするボタンを追加します。	ユーザーがレポートフィルターを操作するときにクエリ削減設定を活用して、不要なクエリを防止します。	-すべてのスライサーを適用およびすべてのスライサーをクリアするボタン。
上流の取り込みで参照整合性が検証されている場合は、テーブル関係を定義するときに「参照整合性を想定」を使用します。	SQL クエリでより効率的な結合戦略を有効にします。	-参照整合性を仮定する
DirectQuery の場合は、クエリの並列化構成設定と、Power BI セマンティックモデルの次のプロパティを確認します。 - データソースあたりの最大接続数 - 同時評価の最大数 - 並列ジョブの最大数 - クエリあたりの最大並列処理数	クエリの並列化が向上し、 SQLウェアハウスの利用率が最大化されて、全体的なパフォーマンスが向上します。	-ダイレクトクエリモードのクエリ並列化 -最大接続数 -構成設定を評価する -データセットのパフォーマンス向上のためのクエリ並列化 -クイックスタート

ベストプラクティス	インパクト	ドキュメント
ユーザー定義集計を使用する	事前に集計されたデータをキャッシュすることにより、大規模な DirectQuery セマンティックモデルでのクエリパフォーマンスが向上します。	-ユーザー定義集計 -クイックスタート
自動集計を使用する	レポートのパフォーマンスを最大化するために、書き込みー履歴に基づいて集計を構築することで、DirectQuery セマンティックモデルを継続的に最適化します。	-自動集計 -クイックスタート
テーブルパーティションまたは増分更新を使用する	特に非常に小さく、静的で、パフォーマンスが重要となる (2 秒未満) レポートの場合、データのインポートを高速化し、大規模なデータセットを管理できます。	-表形式モデルのパーティション -増分更新 -クイックスタート
すべてのスライサーを適用およびすべてのスライサーをクリアするボタンを追加します。	ユーザーがレポートフィルターを操作するときにクエリ削減設定を活用して、不要なクエリを防止します。	-すべてのスライサーを適用およびすべてのスライサーをクリアするボタン。
上流の取り込みで参照整合性が検証されている場合は、テーブル関係を定義するときに「参照整合性を想定」を使用します。	SQL クエリでより効率的な結合戦略を有効にします。	-参照整合性を仮定する
DirectQuery の場合は、クエリの並列化構成設定と、Power BI セマンティックモデルの次のプロパティを確認します。 - データソースあたりの最大接続数 - 同時評価の最大数 - 並列ジョブの最大数 - クエリあたりの最大並列処理数	クエリの並列化が向上し、 SQLウェアハウスの利用率が最大化されて、全体的なパフォーマンスが向上します。	-ダイレクトクエリモードのクエリ並列化 -最大接続数 -構成設定を評価する -データセットのパフォーマンス向上のためのクエリ並列化 -クイックスタート

データモデルを微調整する

ベストプラクティス	インパクト	ドキュメント
「左に移動」変換	コアビジネスロジックをデータソースに近づけることで、データの品質が向上し、速度が速くなり、コストが削減されます。 SQL ビューは Databricks SQL エンジンのパワーを活用して、PowerQuery 変換や DAX 数式に比べてより効率的なレポート実行を実現します。	-ビューとは何ですか? -クイックスタート
DAX 数式を使用する必要がある場合は、DAX 数式を最適化し、結果セットが大きくならないようにしてください。	パフォーマンスの低下につながる非効率的な計算を防止します	-モデルのパフォーマンスを向上させるためのベストプラクティス
セマンティックモデルではDAXの計算列と計算テーブルの使用を避け、このデータをゴールドテーブルで直接定義します。	事前計算されたメジャーはゴールドレイヤーで最高のパフォーマンスを発揮します	-ゴールドレイヤーによるパワーアナリティクス
カレンダーベースの時間インテリジェンスを活用する	DirectQueryセマンティックモデルは、タイムインテリジェンス計算をはるかに効率的に実行し、より高速でスケーラブルなレポートを実現します。	-カレンダーベースの時間インテリジェンス -クイックスタート

ベストプラクティス	インパクト	ドキュメント
「左に移動」変換	コアビジネスロジックをデータソースに近づけることで、データの品質が向上し、速度が速くなり、コストが削減されます。 SQL ビューは Databricks SQL エンジンのパワーを活用して、PowerQuery 変換や DAX 数式に比べてより効率的なレポート実行を実現します。	-ビューとは何ですか? -クイックスタート
DAX 数式を使用する必要がある場合は、DAX 数式を最適化し、結果セットが大きくならないようにしてください。	パフォーマンスの低下につながる非効率的な計算を防止します	-モデルのパフォーマンスを向上させるためのベストプラクティス
セマンティックモデルではDAXの計算列と計算テーブルの使用を避け、このデータをゴールドテーブルで直接定義します。	事前計算されたメジャーはゴールドレイヤーで最高のパフォーマンスを発揮します	-ゴールドレイヤーによるパワーアナリティクス
カレンダーベースの時間インテリジェンスを活用する	DirectQueryセマンティックモデルは、タイムインテリジェンス計算をはるかに効率的に実行し、より高速でスケーラブルなレポートを実現します。	-カレンダーベースの時間インテリジェンス -クイックスタート

パフォーマンスとメトリクスを監視する

ベストプラクティス	インパクト	ドキュメント
Power BI パフォーマンスアナライザーを使用してレポート要素のパフォーマンスを調べる	読み込みに最も時間がかかる視覚化とボトルネックとなっている場所を特定します。	-パフォーマンスアナライザーを使用する

ベストプラクティス	インパクト	ドキュメント
Power BI パフォーマンスアナライザーを使用してレポート要素のパフォーマンスを調べる	読み込みに最も時間がかかる視覚化とボトルネックとなっている場所を特定します。	-パフォーマンスアナライザーを使用する

その他のリソース

このページの見出し

DatabricksとPower BIを接続する
最も適切な保管モードを選択する
データアクセスを最適化する
データモデルを微調整する
パフォーマンスとメトリクスを監視する
その他のリソース