Spark UIを使用したコストとパフォーマンスの問題の診断
このガイドでは、Spark UI を使用してコストとパフォーマンスの問題を診断する方法について説明します。 これはステップバイステップのガイドであり、実用的なハウツーです。 Spark UI の各ページの機能を説明するだけでなく、何を探すべきか、それが何を意味するのかを教えてくれます。 ドライバー、ワーカー、エグゼキューター、ステージ、タスクの概念に詳しくない場合は、Spark のアーキテクチャを確認することをお勧めします。
さまざまな最適化ツールの包括的なリストをお探しの場合は、 Databricks 最適化ガイドをご利用ください。 最適化ガイドのセクションは、この Spark UI ガイドで参照されています。
このガイドの使い方
ガイドをナビゲートするには、各ページに埋め込まれたリンクを使用して、次の手順に進みます。 このガイドには、次の手順が順番に含まれています。
さあ始めましょう!
Spark UIを開く方法
-
クラスターのページに移動します。
-
[Spark UI ] をクリックします。
次のステップ
Spark UI を開いたので、次にイベント タイムラインを確認して、パイプラインまたはクエリの詳細を確認します。 「ジョブのタイムライン」を参照してください。