Pular para o conteúdo principal

Criar uma viewde métricas

Esta página explica o modelo de dados e as considerações usadas nos exemplos que mostram como criar uma view de métricas usando SQL ou a interface do usuário.

Visão geral dataset de amostra

Os exemplos fornecidos em Usar SQL para criar e gerenciar uma visualização de métricas e Criar uma view de métricas usando a interface do usuário do Catalog Explorer usam o dataset TPC-H, que está disponível por default no conjunto de dadosUnity Catalog.

O dataset TPC-H é um dataset de referência padrão usado para avaliar sistemas de suporte à decisão e desempenho de consultas. Ele modela um negócio de cadeia de suprimentos de atacado e é estruturado em torno de operações comerciais comuns, como pedidos, clientes, fornecedores e peças. Representa um ambiente de vendas e distribuição, onde os clientes fazem pedidos de peças fornecidas por vários fornecedores em diferentes nações e regiões.

O esquema tem 8 tabelas:

  • REGION e NATION: Essas tabelas definem o local.

  • CUSTOMER e SUPPLIER: Essas tabelas descrevem entidades comerciais.

  • PART e PARTSUPP: Essas tabelas capturam informações do produto e disponibilidade do fornecedor.

  • ORDERS e LINEITEM: Essas tabelas representam transações, com itens de linha detalhando o produto dentro dos pedidos.

dataset TPC-H ERD

O diagrama a seguir explica os relacionamentos entre as tabelas.

O diagrama de relacionamento de entidade TPC-H mostra os relacionamentos entre tabelas.

Lenda:

  • Os parênteses que seguem cada nome de tabela contêm o prefixo dos nomes das colunas dessa tabela;
  • As setas apontam na direção dos relacionamentos um-para-muitos entre as tabelas;
  • O número/fórmula abaixo de cada nome de tabela representa a cardinalidade (número de linhas) da tabela. Alguns são fatorados pelo SF, o fator escala, para obter o tamanho do banco de dados escolhido. A cardinalidade para a tabela LINEITEM é aproximada (consulte a Cláusula 4.2.5).

(fonte: Especificação Padrão TPC Benchmark H)

Definir uma viewde métricas

Você pode definir uma view de métricas usando SQL DDL ou a interface do usuário do Explorador de Catálogo. Como alternativa, Genie Code pode ajudá-lo a começar a criar sua view de métricas. Em seguida, você pode editar o DDL SQL fornecido ou usar o editor view de métricas na interface do usuário para refinar a definição sugerida.

A view de métricas definida para os exemplos nesta seção foi projetada para que um analista financeiro ou de vendas monitore indicadores- key de desempenho (KPIs) relacionados aos pedidos da empresa. Pode ajudar a responder perguntas como:

  • Como nossa receita total evoluiu ao longo do tempo?
  • Qual é a repartição atual dos nossos pedidos por status (Aberto, Processando, Atendido)?
  • Quais prioridades de pedidos geram mais receita?
  • Quanta receita está atualmente "em risco" ou pendente (ou seja, de pedidos em aberto)?
  • Qual é a receita média gerada por cliente único?

Os componentes necessários estão descritos na tabela a seguir:

Componente

Campo/expressão YAML

Significado de negócios

Tabela de origem

samples.tpch.orders

Os dados brutos contendo registros de pedidos de clientes.

Filtrar

o_orderdate > '1990-01-01'

Concentra a análise apenas em pedidos feitos após 1º de janeiro de 1990, provavelmente excluindo dados históricos ou arquivados.

Dimensão: Mês do Pedido

(DATE_TRUNC('MONTH', o_orderdate))

Permite análise de tendências (mês a mês/ano a ano), acompanhando como o desempenho muda ao longo do tempo.

Dimensão: Status do Pedido

CASE declaração que traduz o status para Open, Processing ou Fulfilled

Permite a segmentação por estágio do ciclo de vida, útil para o atendimento e gerenciamento de pendências.

Dimensão: Prioridade do Pedido

SPLIT declaração que formata a prioridade do pedido como um número

Usado para agrupar o desempenho pela importância estratégica ou urgência do pedido.

Medida: Contagem de pedidos

COUNT(1)

Mede a atividade do volume ventas

Medida: Receita Total

SUM(o_totalprice)

O valor bruto de vendas de todos os pedidos

Medida: Receita Total por Cliente

SUM(o_totalprice) / COUNT(DISTINCT o_custkey)

Uma métrica de valor do cliente útil para avaliar a qualidade das transações do cliente.

Medida: Receita total para pedidos em aberto

SUM(o_totalprice) FILTER (WHERE o_orderstatus='O')

O valor da receita não auferida ou o backlog de vendas atual. Usado para previsão e avaliação de risco.

Pergunte ao código Genie

Genie Code pode ajudar você a começar a definir uma view métrica.

Genie Code gera uma definição view de métricas a partir de uma solicitação em linguagem natural.

  1. Clique Ícone de preenchimento brilhante. Clique no ícone Genie Code no canto superior direito da sua workspace Databricks para abrir Genie Code.
  2. Digite uma descrição da view de métricas que você deseja criar. O Genie Code retorna um DDL SQL que tenta corresponder à sua solicitação.
  3. Copie o SQL fornecido e cole-o no editor SQL. Em seguida, clique em execução .
  4. Edite o SQL ou abra o editor view de métricas para fazer ajustes.

Criar uma nova viewde métricas

Use um dos exemplos a seguir para criar uma nova view de métricas: