メインコンテンツまでスキップ

SQL サービング チートシート

レイクハウス プラットフォームから高速で信頼性の高い分析を提供するには、最適なBIパフォーマンスが得られるようにSQLウェアハウスを構成して操作することが不可欠です。 DatabricksのSQLは、ビジネス インテリジェンスのワークロードを処理することを目的として構築されており、動的なスケーリング、効率的なクエリ処理、堅牢なリソース管理を可能にします。

このページでは、応答性の高いダッシュボード、コスト効率の高いリソースの使用、エンタープライズSQLツールとのスムーズな統合を確保するための、SQL ウェアハウスのプロビジョニング、管理、モニタリングに関する推奨プラクティスについて概説BIます。

このコンテンツは、アナリティクスとダッシュボードのパフォーマンスのためにSQLウェアハウスの構成、最適化、保守を担当するデータ エンジニア、 BI開発者、およびワークスペース管理者を対象としています。 多くのタスクでは、 SQLウェアハウスの作成または管理を可能にする高度なワークスペース権限が必要です。

SQL サービング

ベストプラクティス

インパクト

ドキュメント

操作項目

サーバレス コンピュートを使用してリソースを自動的に開始、停止、スケールします

アイドル状態のリソースを停止することでコストを削減します。

-サーバレスコンピュートに接続する

開発ウェアハウスの 自動停止 を有効にする

BIワークロードにはSQLを使用します (サーバレスを推奨)

SQLはBIワークロード向けに最適化されています。

BIワークロード用にSQLウェアハウスを構成する

ウェアハウスの適切なサイズを調整する

ワークロードのパフォーマンスとコストのバランスをとります。

Mサイズから始めてパフォーマンスを監視し、必要に応じて調整します

データセットが大きい場合は、より大きなクラスターサイズを使用します

クラスターが大きいほど (M、L、XL など)、複雑なクエリの実行速度が速くなります。単純で実行時間の短いクエリのみの場合は、サイズを増やさないでください (データのシャッフルにより速度が低下する可能性があります)。

クエリの複雑さとデータセットのサイズを評価する

SQLウェアハウススケーリングを使用する

SQLウェアハウスは、ワークロードの増加に対処するためにスケールアウトします。 ウェアハウスが制限に達すると、クエリは拒否されるのではなく、キューに入れられます。

本番運用ワークロードのスケーリングを有効にする

多くのブロードキャストクエリが予想される場合は、クラスタの最小数を増やします。

スケールアウトを待機している間にクエリがキューに入れられるのを防ぎます。

予想されるワークロードに基づいて最小クラスターを構成する

異なるワークロードまたはビジネスユニットに個別のSQLウェアハウスを使用する

SQLウェアハウスのサイズを適切にして、分離性とコストの帰属を改善します。

ワークロードごとに専用のウェアハウスを作成する

クエリパフォーマンスを監視する

クエリ履歴を使用してパフォーマンスのボトルネックと問題を特定します。システムテーブルを使用すると、プログラムでパフォーマンスを監視できます。

-クエリ履歴 -システムテーブルのクエリ履歴

モニタリングダッシュボードを設定する

関連コンテンツ

BIワークロード要件の分析と、さまざまなアクセス パターン (DirectQuery とインポート/抽出) に合わせたSQLウェアハウスの構成に関する詳細なガイダンスについては、 「 BIワークロードのSQLウェアハウス設定 」を参照してください。