Revise os resultados dos logs de detecção de anomalia
Por default, os resultados da verificação de monitoramento da qualidade dos dados são armazenados na tabela system.data_quality_monitoring.table_results . Somente os administradores account podem acessar esta tabela e devem conceder acesso a outros conforme necessário. O monitoramento de qualidade de dados utiliza armazenamentodefault para armazenar os resultados de detecção de anomalia. Você não será cobrado pelo armazenamento.
A tabela de resultados system.data_quality_monitoring.table_results contém todos os resultados em todo o metastore e inclui valores de amostra de tabelas em cada catálogo. Tenha cautela ao conceder acesso a esta tabela.
esquema da tabela de resultados de detecção de anomalia
Cada linha na tabela de resultados corresponde a uma única tabela no esquema que foi analisado.
A tabela possui o seguinte esquema:
Nome da coluna | Conteúdo (para o tipo de dados | Tipo de dados | Descrição | Dados de exemplo |
|---|---|---|---|---|
| carimbo de data/hora | Hora em que a linha foi gerada. |
| |
| string | Nome do catálogo. Utilizado para identificar a mesa. |
| |
| string | Nome do esquema. Utilizado para identificar a mesa. |
| |
| string | Nome da tabela. Utilizado para identificar a mesa. |
| |
| string | ID estável para o catálogo. |
| |
| string | ID estável para o esquema. |
| |
| string | ID estável para a tabela. |
| |
| string | Estado de saúde consolidado ao nível da tabela. |
| |
| struct | Verificações de frescor. | ||
| string | Estado geral de frescor. |
| |
| confirmar resultados da verificação de frescor. | |||
| struct | Resultados da verificação de integridade. | ||
| string | Status da verificação de integridade. |
| |
| Número total de linhas na tabela ao longo do tempo. | |||
| Número de linhas adicionadas a cada dia. | |||
| struct | Resumo do impacto a jusante com base no gráfico de dependência. | ||
| int | Indicador de gravidade ( |
| |
| int | Número de tabelas subsequentes afetadas. |
| |
| int | Número de consultas executadas nas tabelas downstream afetadas nos últimos 30 dias. |
| |
| struct | informações sobre o trabalho upstream que contribui para o problema. | ||
| Metadados para cada tarefa upstream. |
commit_freshness estrutura de matriz
A estrutura commit_freshness contém o seguinte:
Nome do item | Tipo de dados | Descrição | Dados de exemplo |
|---|---|---|---|
| string | Status da verificação de atualização do commit. |
|
| string | Mensagem de erro encontrada durante a verificação. |
|
| carimbo de data/hora | Data e hora do último commit. |
|
| carimbo de data/hora | Tempo previsto para a atualização da tabela. |
|
Estrutura de matriz total_row_count e daily_row_count
As estruturas total_row_count e daily_row_count contêm o seguinte:
Nome do item | Tipo de dados | Descrição | Dados de exemplo |
|---|---|---|---|
| string | Situação da verificação. |
|
| string | Mensagem de erro encontrada durante a verificação. |
|
| int | Número de linhas observadas nas últimas 24 horas. |
|
| int | Número mínimo esperado de linhas nas últimas 24 horas. |
|
| int | Número máximo esperado de linhas nas últimas 24 horas. |
|
upstream_jobs estrutura de matriz
A estrutura da matriz mostrada na coluna upstream_jobs é apresentada na tabela a seguir:
Nome do item | Tipo de dados | Descrição | Dados de exemplo |
|---|---|---|---|
| string | ID Job . |
|
| string | ID do espaço de trabalho. |
|
| string | Nome de exibição Job . |
|
| string | Estado da execução mais recente. |
|
| string | URL da página de execução do trabalho Databricks . |
|
Informações sobre impacto a jusante
Na tabela de resultados de logs, a coluna downstream_impact é um struct com os seguintes campos:
campo | Tipo | Descrição |
|---|---|---|
| int | Valor inteiro entre 1 e 4 que indica a gravidade do problema de qualidade dos dados. Valores maiores indicam maior interrupção. |
| int | Número de tabelas subsequentes que podem ser afetadas pelo problema identificado. |
| int | Número total de consultas que fizeram referência às tabelas afetadas e às tabelas subsequentes nos últimos 30 dias. |