異常検出ログの結果を確認する
もちろん、データ品質モニタリング スキャン結果はsystem.data_quality_monitoring.table_resultsテーブルに保存されます。 このテーブルにアクセスできるのはアカウント管理者のみであり、必要に応じて他のユーザーにアクセス権を付与する必要があります。データ品質モニタリングでは、異常検出結果を保存するためにストレージを使用します。 ストレージに対して料金は請求されません。
結果テーブルsystem.data_quality_monitoring.table_resultsには、メタストア全体のすべての結果が含まれており、各カタログのテーブルからのサンプル値も含まれています。このテーブルへのアクセスを許可する場合は注意してください。
異常検出結果テーブルスキーマ
結果テーブルの各行は、スキャンされたスキーマ内の単一のテーブルに対応します。
テーブルのスキーマは次のとおりです。
列名 | コンテンツ( | データ型 | 説明 | サンプルデータ |
|---|---|---|---|---|
| timestamp | 行が生成された時刻。 |
| |
| string | カタログの名前。テーブルを識別するために使用されます。 |
| |
| string | スキーマの名前。テーブルを識別するために使用されます。 |
| |
| string | テーブルの名前。テーブルを識別するために使用されます。 |
| |
| string | カタログの安定した ID。 |
| |
| string | スキーマの安定した ID。 |
| |
| string | テーブルの安定した ID。 |
| |
| string | テーブル レベルで統合されたヘルス ステータス。いずれかのチェックまたはグループが正常でない場合は |
| |
| struct | 鮮度チェック。 | ||
| string | 全体的な鮮度の状態。 |
| |
| コミットの鮮度チェック結果。 | |||
| struct | 完全性チェックの結果。 | ||
| string | 完全性チェックのステータス。 |
| |
| 一定期間にわたるテーブル内の行の合計数。 | |||
| 毎日追加される行数。 | |||
| struct | 依存関係グラフに基づく下流への影響の概要。 | ||
| int | 重大度インジケーター ( |
| |
| int | 影響を受けるダウンストリーム テーブルの数。 |
| |
| int | 過去 30 日間に影響を受けていたダウンストリーム テーブルで実行されたクエリの数。 |
| |
| struct | 問題の原因となっている上流のジョブに関する情報。 | ||
| 各アップストリームジョブのメタデータ。 |
commit_freshness配列構造
commit_freshness構造体には次のものが含まれています。
アイテム名 | データ型 | 説明 | サンプルデータ |
|---|---|---|---|
| string | コミットの鮮度チェックのステータス。 |
|
| string | チェック中にエラー メッセージが検出されました。 |
|
| timestamp | 最後のコミットのタイムスタンプ。 |
|
| timestamp | テーブルが更新されるはずだった予測時刻。 |
|
total_row_countとdaily_row_count配列構造
total_row_countおよびdaily_row_count構造体には次の内容が含まれます。
アイテム名 | データ型 | 説明 | サンプルデータ |
|---|---|---|---|
| string | チェックのステータス。 |
|
| string | チェック中にエラー メッセージが検出されました。 |
|
| int | 過去 24 時間に観測された行数。 |
|
| int | 過去 24 時間の最小予想行数。 |
|
| int | 過去 24 時間の予想行数の最大数。 |
|
upstream_jobs配列構造
upstream_jobs列に表示される配列の構造を次の表に示します。
アイテム名 | データ型 | 説明 | サンプルデータ |
|---|---|---|---|
| string | ジョブ ID。 |
|
| string | ワークスペース ID。 |
|
| string | ジョブの表示名。 |
|
| string | 最新の実行のステータス。 |
|
| string | Databricks ジョブ実行ページの URL。 |
|
下流への影響情報
ログに記録された結果テーブルでは、列downstream_impactは次のフィールドを持つstructです。
フィールド | Type | 説明 |
|---|---|---|
| int | データ品質の問題の重大度を示す 1 ~ 4 の整数値。値が高いほど混乱が大きいことを示します。 |
| int | 特定された問題の影響を受ける可能性があるダウンストリーム テーブルの数。 |
| int | 過去 30 日間に影響を受けるテーブルとダウンストリーム テーブルを参照したクエリの合計数。 |