Visualização de métricas de consulta a partir de ferramentas BI
Beta
Este recurso está em versão Beta.
O modo de compatibilidade BI permite consultar a visualização de métricasUnity Catalog a partir de ferramentas BI externas. Quando ativado, Databricks reescreve as consultas geradas pela ferramenta BI para avaliar corretamente as métricas view .
Esta página explica como ativar o modo de compatibilidade com BI, como ele funciona, os cenários suportados e as limitações conhecidas.
Requisitos
A Microsoft removeu a opção de modo de compatibilidade com BI do conector do Power BI para o Databricks . Os relatórios que utilizam essa opção de conector deixaram de funcionar. Para solicitar a restauração do suporte à visualização de métricas Databricks no Power BI, vote e envie seu feedback na publicação da comunidade Fabric Ideas. Como alternativa ao Power BI, considere os dashboardsAI/BI Databricks , que funcionam nativamente com a visualização de métricas.
- Um cluster que executa Databricks Runtime 18.0 ou acima.
- Uma ferramenta de BI que suporta conexões SQL ou DirectQuery diretas com o Databricks.
- A capacidade de executar configurações SQL em nível de sessão na ferramenta BI (por exemplo, por meio de um script SQL inicial ou comando startup ).
Ativar o modo de compatibilidade com BI
Habilite o modo de compatibilidade BI executando o seguinte comando de configuração SQL no início da sua sessão:
SET spark.databricks.sql.metricView.bi.compatibilityMode.enabled = true;
A forma de configurar depende da sua ferramenta de BI. Por exemplo, no Tableau, você pode usar o campo SQL inicial na caixa de diálogo de conexão.
O modo de compatibilidade com BI aplica-se apenas à sessão em que foi configurado. Cada nova conexão deve ser configurada novamente.
Modo DirectQuery
O modo de compatibilidade BI exige que as consultas sejam executadas no mecanismo Databricks SQL . Se a sua ferramenta de BI oferece modos de importação e consulta direta, use a consulta direta (ou conexão em tempo real) para que as consultas sejam encaminhadas para o Databricks, onde o mecanismo de reescrita pode ser aplicado.
Como funciona o modo de compatibilidade com BI
As métricas aparecem como tabelas comuns para as ferramentas BI . Quando o modo de compatibilidade BI está ativado, Databricks reescreve as consultas geradas pela ferramenta BI para consultar corretamente a view de métricas.
O modo de compatibilidade com BI lida automaticamente com dois tipos de consultas:
- Consultas de agregação : Quando uma ferramenta BI gera uma consulta com funções de agregação padrão (como
SUM) em métricas, o modo de compatibilidade BI reescreve essas agregações para se adequarem às definições de métrica na sua view de métricas. Use sempreSUMcomo tipo de agregação para colunas de medidas. O mecanismo SQL sempre aplica a lógica de medida subjacente correta. - Visualização prévia de dados e descoberta de esquema : Quando a ferramenta de BI solicita dados não agregados (por exemplo, visualizações prévias de colunas ou amostras de dados), as colunas de medida retornam valores nulos em vez de um erro. As colunas de dimensão retornam seus valores normalmente.
Cenários suportados
A lista de recursos da ferramenta BI a seguir funciona para a maioria das ferramentas BI quando o modo de compatibilidade BI está ativado.
Cenário | Descrição |
|---|---|
Visualização de medidas básicas | Utilize uma medida em um gráfico ou campo de valor de tabela para exibir resultados agregados. |
Filtros | Aplique filtros às colunas de dimensão ou medida em seus visuais. |
Fatiadores dimensionais | Use colunas de dimensão como controles de segmentação ou filtro. |
Filtragem cruzada | Clique em um valor em um visual para filtrar visuais relacionados na mesma página. |
Perfuração | Acesse uma página de detalhes filtrada por um valor específico. |
Filtragem TopN | Exibir os N valores superiores ou inferiores classificados por coluna. |
Pré-visualização de dados | Utilize a pré-visualização de dados e a descoberta de esquemas. As medidas aparecem como nulas nas pré-visualizações. |
Cálculos visuais | Cálculos realizados no lado do cliente, aplicados a resultados já agregados (por exemplo, totais acumulados e classificação). |
Dimensões versus medidas
A visualização de métricas contém dois tipos de colunas: medidas e dimensões. Compreender a diferença é importante na elaboração de relatórios.
- Medidas : A lógica de agregação de uma medida é definida na view de medidas (por exemplo,
SUM(price * quantity)ouCOUNT(DISTINCT customer_id)). Na sua ferramenta de BI, deixe sempre a agregação definida comoSUMpara colunas de medidas. O mecanismo SQL aplica automaticamente a lógica de medida correta. Se você precisar de uma agregação diferente, modifique a definição da métrica na própria view de métricas. Não altere a agregação no lado da ferramenta de BI. - Dimensões : As dimensões comportam-se como colunas de tabela comuns. Você pode aplicar qualquer operação padrão BI às dimensões, incluindo agregações, agrupamentos, filtragem, classificação e categorização. Se um campo numérico funcionar como uma dimensão (e não como uma medida), todos os tipos de agregação padrão funcionarão normalmente nesse campo.
Melhores práticas
- Inclua sempre uma única view de métricas em seu conjunto de dados. A view métrica é a sua definição semântica.
- Crie pastas para organizar as colunas de dimensão (por exemplo, uma pasta "Data" para cada coluna da dimensão Data).
- Renomeie as dimensões para que tenham nomes mais fáceis de usar.
- Alterar as colunas de dimensão numérica para um tipo de sumarização não agregada.
- Crie medidas de encapsulamento usando
SUM()para cada coluna de medida e oculte as colunas de medida originais (por exemplo,Total Sales = SUM('Store Sales'[total_sales])). - Organize as medidas em uma pasta específica.
- Utilize apenas medidas de contêiner em seus elementos visuais.
Limitações
O modo de compatibilidade com BI tem controle limitado sobre como as ferramentas de BI geram e processam consultas. Aplicam-se as seguintes limitações.
Utilize a função SUM somente para agregações de medidas.
Deixe sempre o tipo de agregação definido como SUM para colunas de medida. Todas as funções de agregação (SUM, COUNT, MIN, MAX) são reescritas para a definição da medida subjacente, então todas retornam o mesmo resultado. Selecionar um tipo de agregação diferente pode levar a comportamentos inesperados:
AVGmostra1.0porque algumas ferramentas BI computeAVGcomoSUM / COUNTinternamente, e ambos retornam o mesmo valor de medida.- Contagem (distinta), Desvio Padrão, Variância e Mediana geram padrões de consulta incompatíveis com o mecanismo de reescrita e produzem erros ou resultados incorretos.
Se você precisar de uma agregação diferente, modifique a definição da métrica na view de métricas. Todos os tipos de agregação são totalmente suportados nas definições view de métricas.
Totais gerais para medidas não aditivas
Algumas ferramentas de BI calculam os totais gerais reagregando os valores por grupo no lado do cliente, em vez de emitir uma consulta separada. Isso produz resultados corretos para medidas aditivas (por exemplo, SUM(revenue)) porque a reagregação local fornece a resposta correta.
Entretanto, para medidas não aditivas (por exemplo, SUM(revenue) / COUNT(DISTINCT customer), ou qualquer razão, percentagem ou expressão envolvendo DISTINCT), os totais gerais podem apresentar valores incorretos porque somar razões pré-agrupadas não é matematicamente equivalente a calcular a razão sobre o conjunto de dados completo.
Segmentadores quantitativos em colunas de medidas
Um filtro quantitativo (de intervalo) em uma coluna de medida pode não funcionar como esperado. Algumas ferramentas de BI podem consultar os valores MIN e MAX da medida para determinar o intervalo do controle deslizante, mas ambos são reescritos para o mesmo valor da medida subjacente, reduzindo o intervalo a um único ponto. Os filtros nas métricas ainda funcionam. Apenas os fatiadores de intervalo são afetados.
As medidas não podem ser usadas como valores categóricos ou dimensionais.
Se você usar uma coluna de medida como um valor categórico (por exemplo, como um eixo, legenda ou segmentador de dados), a consulta falhará e retornará o seguinte erro:
Measure columns cannot be used in GROUP BY clause or as categorical values. We recommend wrapping them with an aggregate function such as SUM() for the expected behavior.
Campos calculados com múltiplas medidas
Os campos calculados que fazem referência a uma única medida funcionam corretamente. Algumas ferramentas de BI primeiro buscam o resultado agregado e depois realizam o cálculo no lado do cliente (por exemplo, categorizando a receita em níveis baixo, médio e alto).
No entanto, expressões que combinam várias colunas de medidas dentro de um único agregado (por exemplo, SUM(m1 + m2)) não são reescritas pelo modo de compatibilidade de BI e produzem erros ou resultados inesperados.
Unindo a visualização da tabela com outras tabelas.
Não é possível join a visualização de métricas com outras tabelas na ferramenta BI . Se for necessário combinar dados de uma view de métricas com outra tabela, incorpore a join na própria definição view de métricas.
Visão materializada de Mesh
O modo de compatibilidade BI não suporta a visualização de métricas com materializações, e isso pode produzir resultados inesperados.