メインコンテンツまでスキップ

Spark がデータを書き換えているかどうかを確認する方法

まず、書き込みステージの SQL DAG を開きます。ジョブのページの上部までスクロールし、関連するSQLクエリをクリックします。

SQL へのステージング

DAG が表示されます。 そうでない場合は、少しスクロールすると表示されます。

SQL DAG

削除操作または更新操作を実行している場合は、ライターによって書き込まれるデータの量と予想されるデータの量を確認します。予想よりも多くのデータが書き込まれている場合は、データを書き換えている可能性があります。

統計の書き込み

マージを実行している場合、マージノードには、書き換えるデータの量に関する明示的な統計があります。