Pular para o conteúdo principal

Criar uma viewde métricas

Esta página explica o modelo de dados e as considerações usadas nos exemplos que mostram como criar uma view de métricas usando SQL ou a interface do usuário.

Visão geral dataset de amostra

Os exemplos fornecidos em Usar SQL para criar e gerenciar uma visualização de métricas e Criar uma view de métricas usando a interface do usuário do Catalog Explorer usam o dataset TPC-H, que está disponível por default no conjunto de dadosUnity Catalog.

O dataset TPC-H é um dataset de referência padrão usado para avaliar sistemas de suporte à decisão e desempenho de consultas. Ele modela um negócio de cadeia de suprimentos de atacado e é estruturado em torno de operações comerciais comuns, como pedidos, clientes, fornecedores e peças. Representa um ambiente de vendas e distribuição, onde os clientes fazem pedidos de peças fornecidas por vários fornecedores em diferentes nações e regiões.

O esquema tem 8 tabelas:

  • REGION e NATION: Essas tabelas definem o local.

  • CUSTOMER e SUPPLIER: Essas tabelas descrevem entidades comerciais.

  • PART e PARTSUPP: Essas tabelas capturam informações do produto e disponibilidade do fornecedor.

  • ORDERS e LINEITEM: Essas tabelas representam transações, com itens de linha detalhando o produto dentro dos pedidos.

dataset TPC-H ERD

O diagrama a seguir explica os relacionamentos entre as tabelas.

O diagrama de relacionamento de entidade TPC-H mostra os relacionamentos entre tabelas.

Lenda:

  • Os parênteses que seguem cada nome de tabela contêm o prefixo dos nomes das colunas dessa tabela;
  • As setas apontam na direção dos relacionamentos um-para-muitos entre as tabelas;
  • O número/fórmula abaixo de cada nome de tabela representa a cardinalidade (número de linhas) da tabela. Alguns são fatorados pelo SF, o fator escala, para obter o tamanho do banco de dados escolhido. A cardinalidade para a tabela LINEITEM é aproximada (consulte a Cláusula 4.2.5).

(fonte: Especificação Padrão TPC Benchmark H)

Definir uma viewde métricas

Você pode definir uma view de métricas usando SQL DDL ou a interface do usuário do Catalog Explorer. Como alternativa, Databricks Assistant pode ajudar você a começar a criar sua view de métricas. Em seguida, você pode editar o DDL SQL fornecido ou usar o editor view de métricas na interface do usuário para refinar a definição sugerida.

A view de métricas definida para os exemplos nesta seção foi projetada para que um analista financeiro ou de vendas monitore indicadores- key de desempenho (KPIs) relacionados aos pedidos da empresa. Pode ajudar a responder perguntas como:

  • Como nossa receita total evoluiu ao longo do tempo?
  • Qual é a repartição atual dos nossos pedidos por status (Aberto, Processando, Atendido)?
  • Quais prioridades de pedidos geram mais receita?
  • Quanta receita está atualmente "em risco" ou pendente (ou seja, de pedidos em aberto)?
  • Qual é a receita média gerada por cliente único?

Os componentes necessários estão descritos na tabela a seguir:

Componente

Campo/expressão YAML

Significado de negócios

Tabela de origem

samples.tpch.orders

Os dados brutos contendo registros de pedidos de clientes.

Filtrar

o_orderdate > '1990-01-01'

Concentra a análise apenas em pedidos feitos após 1º de janeiro de 1990, provavelmente excluindo dados históricos ou arquivados.

Dimensão: Mês do Pedido

(DATE_TRUNC('MONTH', o_orderdate))

Permite análise de tendências (mês a mês/ano a ano), acompanhando como o desempenho muda ao longo do tempo.

Dimensão: Status do Pedido

CASE declaração que traduz o status para Open, Processing ou Fulfilled

Permite a segmentação por estágio do ciclo de vida, útil para o atendimento e gerenciamento de pendências.

Dimensão: Prioridade do Pedido

SPLIT declaração que formata a prioridade do pedido como um número

Usado para agrupar o desempenho pela importância estratégica ou urgência do pedido.

Medida: Contagem de pedidos

COUNT(1)

Mede a atividade do volume ventas

Medida: Receita Total

SUM(o_totalprice)

O valor bruto de vendas de todos os pedidos

Medida: Receita Total por Cliente

SUM(o_totalprice) / COUNT(DISTINCT o_custkey)

Uma métrica de valor do cliente útil para avaliar a qualidade das transações do cliente.

Medida: Receita total para pedidos em aberto

SUM(o_totalprice) FILTER (WHERE o_orderstatus='O')

O valor da receita não auferida ou o backlog de vendas atual. Usado para previsão e avaliação de risco.

Pergunte Databricks Assistant

Databricks Assistant pode ajudar você a começar a definir uma view de métricas.

  1. Clique Ícone de preenchimento brilhante. o ícone do Assistente no canto superior direito do seu workspace Databricks para abrir o assistente.
  2. Digite uma descrição da view de métricas que você deseja criar. O Assistente retorna um DDL SQL que tenta corresponder à sua solicitação.
  3. Copie o SQL fornecido e cole-o no editor SQL. Em seguida, clique em execução .
  4. Edite o SQL ou abra o editor view de métricas para fazer ajustes.

Criar uma nova viewde métricas

Use um dos exemplos a seguir para criar uma nova view de métricas: