SQL サービング チートシート
レイクハウス プラットフォームから高速で信頼性の高い分析を提供するには、最適なBIパフォーマンスが得られるようにSQLウェアハウスを構成して操作することが不可欠です。 DatabricksのSQLは、ビジネス インテリジェンスのワークロードを処理することを目的として構築されており、動的なスケーリング、効率的なクエリ処理、堅牢なリソース管理を可能にします。
このページでは、応答性の高いダッシュボード、コスト効率の高いリソースの使用、エンタープライズSQLツールとのスムーズな統合を確保するための、SQL ウェアハウスのプロビジョニング、管理、モニタリングに関する推奨プラクティスについて概説BIます。
このコンテンツは、アナリティクスとダッシュボードのパフォーマンスのためにSQLウェアハウスの構成、最適化、保守を担当するデータ エンジニア、 BI開発者、およびワークスペース管理者を対象としています。 多くのタスクでは、 SQLウェアハウスの作成または管理を可能にする高度なワークスペース権限が必要です。
SQL サービング
ベストプラクティス | インパクト | ドキュメント | 操作項目 |
|---|---|---|---|
サーバレス コンピュートを使用してリソースを自動的に開始、停止、スケールします | アイドル状態のリソースを停止することでコストを削減します。 | 開発ウェアハウスの 自動停止 を有効にする | |
BIワークロードにはSQLを使用します (サーバレスを推奨) | SQLはBIワークロード向けに最適化されています。 | BIワークロード用にSQLウェアハウスを構成する | |
ウェアハウスの適切なサイズを調整する | ワークロードのパフォーマンスとコストのバランスをとります。 | Mサイズから始めてパフォーマンスを監視し、必要に応じて調整します | |
データセットが大きい場合は、より大きなクラスターサイズを使用します | クラスターが大きいほど (M、L、XL など)、複雑なクエリの実行速度が速くなります。単純で実行時間の短いクエリのみの場合は、サイズを増やさないでください (データのシャッフルにより速度が低下する可能性があります)。 | クエリの複雑さとデータセットのサイズを評価する | |
SQLウェアハウススケーリングを使用する | SQLウェアハウスは、ワークロードの増加に対処するためにスケールアウトします。 ウェアハウスが制限に達すると、クエリは拒否されるのではなく、キューに入れられます。 | 本番運用ワークロードのスケーリングを有効にする | |
多くのブロードキャストクエリが予想される場合は、クラスタの最小数を増やします。 | スケールアウトを待機している間にクエリがキューに入れられるのを防ぎます。 | 予想されるワークロードに基づいて最小クラスターを構成する | |
異なるワークロードまたはビジネスユニットに個別のSQLウェアハウスを使用する | SQLウェアハウスのサイズを適切にして、分離性とコストの帰属を改善します。 | ワークロードごとに専用のウェアハウスを作成する | |
クエリパフォーマンスを監視する | クエリ履歴を使用してパフォーマンスのボトルネックと問題を特定します。システムテーブルを使用すると、プログラムでパフォーマンスを監視できます。 | モニタリングダッシュボードを設定する |
関連コンテンツ
BIワークロード要件の分析と、さまざまなアクセス パターン (DirectQuery とインポート/抽出) に合わせたSQLウェアハウスの構成に関する詳細なガイダンスについては、 「 BIワークロードのSQLウェアハウス設定 」を参照してください。