Revise os resultados dos logs de detecção de anomalia
Por default, os resultados da verificação de monitoramento da qualidade dos dados são armazenados na tabela system.data_quality_monitoring.table_results . Somente os administradores account podem acessar esta tabela e devem conceder acesso a outros conforme necessário. O monitoramento de qualidade de dados utiliza armazenamentodefault para armazenar os resultados de detecção de anomalia. Você não será cobrado pelo armazenamento.
A tabela de resultados system.data_quality_monitoring.table_results contém todos os resultados em todo o metastore e inclui valores de amostra de tabelas em cada catálogo. Tenha cautela ao conceder acesso a esta tabela.
esquema da tabela de resultados de detecção de anomalia
Cada linha na tabela de resultados corresponde a uma única tabela no esquema que foi analisado.
A tabela possui o seguinte esquema:
Nome da coluna  | Conteúdo (para o tipo de dados   | Tipo de dados  | Descrição  | Dados de exemplo  | 
|---|---|---|---|---|
  | carimbo de data/hora  | Hora em que a linha foi gerada.  | 
  | |
  | string  | Nome do catálogo. Utilizado para identificar a mesa.  | 
  | |
  | string  | Nome do esquema. Utilizado para identificar a mesa.  | 
  | |
  | string  | Nome da tabela. Utilizado para identificar a mesa.  | 
  | |
  | string  | ID estável para o catálogo.  | 
  | |
  | string  | ID estável para o esquema.  | 
  | |
  | string  | ID estável para a tabela.  | 
  | |
  | string  | Estado de saúde consolidado ao nível da tabela.   | 
  | |
  | struct  | Verificações de frescor.  | ||
  | string  | Estado geral de frescor.  | 
  | |
  | confirmar resultados da verificação de frescor.  | |||
  | struct  | Resultados da verificação de integridade.  | ||
  | string  | Status da verificação de integridade.  | 
  | |
  | Número total de linhas na tabela ao longo do tempo.  | |||
  | Número de linhas adicionadas a cada dia.  | |||
  | struct  | Resumo do impacto a jusante com base no gráfico de dependência.  | ||
  | int  | Indicador de gravidade (  | 
  | |
  | int  | Número de tabelas subsequentes afetadas.  | 
  | |
  | int  | Número de consultas executadas nas tabelas downstream afetadas nos últimos 30 dias.  | 
  | |
  | struct  | informações sobre o trabalho upstream que contribui para o problema.  | ||
  | Metadados para cada tarefa upstream.  | 
 commit_freshness estrutura de matriz
A estrutura commit_freshness contém o seguinte:
Nome do item  | Tipo de dados  | Descrição  | Dados de exemplo  | 
|---|---|---|---|
  | string  | Status da verificação de atualização do commit.  | 
  | 
  | string  | Mensagem de erro encontrada durante a verificação.  | 
  | 
  | carimbo de data/hora  | Data e hora do último commit.  | 
  | 
  | carimbo de data/hora  | Tempo previsto para a atualização da tabela.  | 
  | 
 Estrutura de matriz total_row_count e daily_row_count
As estruturas total_row_count e daily_row_count contêm o seguinte:
Nome do item  | Tipo de dados  | Descrição  | Dados de exemplo  | 
|---|---|---|---|
  | string  | Situação da verificação.  | 
  | 
  | string  | Mensagem de erro encontrada durante a verificação.  | 
  | 
  | int  | Número de linhas observadas nas últimas 24 horas.  | 
  | 
  | int  | Número mínimo esperado de linhas nas últimas 24 horas.  | 
  | 
  | int  | Número máximo esperado de linhas nas últimas 24 horas.  | 
  | 
 upstream_jobs estrutura de matriz
A estrutura da matriz mostrada na coluna upstream_jobs é apresentada na tabela a seguir:
Nome do item  | Tipo de dados  | Descrição  | Dados de exemplo  | 
|---|---|---|---|
  | string  | ID Job .  | 
  | 
  | string  | ID do espaço de trabalho.  | 
  | 
  | string  | Nome de exibição Job .  | 
  | 
  | string  | Estado da execução mais recente.  | 
  | 
  | string  | URL da página de execução do trabalho Databricks .  | 
  | 
Informações sobre impacto a jusante
Na tabela de resultados de logs, a coluna downstream_impact é um struct com os seguintes campos:
campo  | Tipo  | Descrição  | 
|---|---|---|
  | int  | Valor inteiro entre 1 e 4 que indica a gravidade do problema de qualidade dos dados. Valores maiores indicam maior interrupção.  | 
  | int  | Número de tabelas subsequentes que podem ser afetadas pelo problema identificado.  | 
  | int  | Número total de consultas que fizeram referência às tabelas afetadas e às tabelas subsequentes nos últimos 30 dias.  |