メインコンテンツまでスキップ

Power BI チートシート

このページでは、Power BI と SAP Databricks でデータを効率的に管理して、クエリ パフォーマンスを最適化し、効率的なダッシュボードを作成するための明確で説得力のあるガイダンスを提供します。

SAP Databricks で Power BI を使用するためのベスト プラクティスのリファレンス実装を示す実用的なクイックスタートのセットについては、このリポジトリを参照してください。

SAP Databricks と Power BI を接続する

ベストプラクティス

インパクト

ドキュメント

異なる SAP Databricks環境に接続する場合はPower BIを使用する

異なる SAP Databricks ワークスペースまたは異なる SAP Databricks SQL ウェアハウスに接続する際の柔軟性が向上します。

SAP Databricks の Power BI サービスへの公開機能を使用する

SAP Databricks UI を離れることなく、シームレスなカタログ統合とデータモデルの同期を可能にします。

最も適切な保管モードを選択する

ベストプラクティス

インパクト

ドキュメント

ファクト テーブルには DirectQuery を使用し、ディメンション テーブルには Dual を使用します (インポートではありません)

最も適切なストレージ モードを使用して、より効率的な SQL クエリを生成します。

可能な限り、インポートよりも DirectQuery を優先する

ガバナンスと可聴性を維持できます。

混合ストレージモードには複合モデルを使用する

DirectQuery、デュアル、インポート モード テーブル、集計テーブル、ハイブリッド テーブルの混在使用を許可します。

集計されたヒストリカルデータと保留データのハイブリッド テーブルを使用する

効率的なメモリ内クエリを有効にします。

-ハイブリッドテーブル

データアクセスを最適化する

ベストプラクティス

インパクト

ドキュメント

ユーザー定義集計を使用する

事前に集計されたデータをキャッシュすることにより、大規模な DirectQuery セマンティック モデルでのクエリ パフォーマンスが向上します。

-ユーザー定義集計 -クイックスタート

自動集計を使用する

レポートのパフォーマンスを最大化するために、書き込みー履歴に基づいて集計を構築することで、DirectQuery セマンティック モデルを継続的に最適化します。

-自動集計 -クイックスタート

テーブルパーティションまたは増分更新を使用する

特に非常に小さく、静的で、パフォーマンスが重要となる (2 秒未満) レポートの場合、データのインポートを高速化し、大規模なデータセットを管理できます。

-表形式モデルのパーティション -増分更新 -クイックスタート

すべてのスライサーを適用 および すべてのスライサーをクリアする ボタンを追加します。

ユーザーがレポート フィルターを操作するときにクエリ削減設定を活用して、不要なクエリを防止します。

-すべてのスライサーを適用およびすべてのスライサーをクリアするボタン

上流の取り込みで 参照整合性が検証されている場合は、テーブル関係を定義するときに「参照整合性を想定」を 使用します。

SQL クエリでより効率的な結合戦略を有効にします。

-参照整合性を仮定する

DirectQuery の場合は、クエリの並列化構成設定と、Power BI セマンティック モデルの次のプロパティを確認します。 - データソースあたりの最大接続数 - 同時評価の最大数 - 並列ジョブの最大数 - クエリあたりの最大並列処理数

クエリの並列化が向上し、 SQLウェアハウスの利用率が最大化されて、全体的なパフォーマンスが向上します。

-ダイレクトクエリモードのクエリ並列化 -最大接続数 -構成設定を評価する -データセットのパフォーマンス向上のためのクエリ並列化 -クイックスタート

データモデルを微調整する

ベストプラクティス

インパクト

ドキュメント

「左に移動」変換

コアビジネス ロジックをデータソースに近づけることで、データの品質が向上し、速度が速くなり、コストが削減されます。 SQL ビューは Databricks SQL エンジンのパワーを活用して、PowerQuery 変換や DAX 数式に比べてより効率的なレポート実行を実現します。

-クイックスタート

DAX 数式を使用する必要がある場合は、DAX 数式を最適化し、結果セットが大きくならないようにしてください。

パフォーマンスの低下につながる非効率的な計算を防止します

-モデルのパフォーマンスを向上させるためのベストプラクティス

カレンダーベースの時間インテリジェンスを活用する

DirectQueryセマンティックモデルは、タイムインテリジェンス計算をはるかに効率的に実行し、より高速でスケーラブルなレポートを実現します。

-カレンダーベースの時間インテリジェンス -クイックスタート

パフォーマンスとメトリクスを監視する

ベストプラクティス

インパクト

ドキュメント

Power BI パフォーマンス アナライザーを使用してレポート要素のパフォーマンスを調べる

読み込みに最も時間がかかる視覚化とボトルネックとなっている場所を特定します。

-パフォーマンスアナライザーを使用する