Pular para o conteúdo principal

Folha de dicas do Power BI

Esta página fornece orientações claras e opinativas para gerenciar seus dados de forma eficiente no Power BI e no Databricks para otimizar o desempenho das consultas e criar painéis eficientes.

Conectar Databricks e Power BI

Melhores práticas

Impacto

Documentos

Use parâmetros do Power BI ao conectar-se a diferentes ambientes do Databricks

Permite flexibilidade ao conectar-se a diferentes espaços de trabalho Databricks ou diferentes armazéns Databricks SQL .

Use a funcionalidade de publicação do serviço do Power BI do Databricks

Permite integração perfeita de catálogos e sincronização de modelos de dados sem sair da interface do usuário do Databricks.

Use a publicação automática do Databricks no Power BI

Publique o conjunto de dados do Unity Catalog no Power BI diretamente do pipeline de dados.

Escolha o modo de armazenamento mais apropriado

Melhores práticas

Impacto

Documentos

Use DirectQuery para tabelas de fatos e Dual para tabelas de dimensões (não Importar)

Gere consultas SQL mais eficientes usando o modo de armazenamento mais adequado.

Prefira DirectQuery em vez de Import sempre que possível

Permite que você mantenha a governança e a audibilidade.

Use modelos compostos para modos de armazenamento mistos

Permite o uso misto de tabelas DirectQuery, Dual, modo de importação e tabelas de agregação e híbridas.

Utilize tabelas híbridas para dados históricos agregados com dados tempo-real

Permite consultas eficientes na memória.

Otimizar o acesso aos dados

Melhores práticas

Impacto

Documentos

Use agregações definidas pelo usuário

Melhora o desempenho da consulta em grandes modelos semânticos do DirectQuery armazenando em cache dados pré-agregados.

Usar agregações automáticas

Otimiza continuamente os modelos semânticos do DirectQuery criando agregações com base no Query History para obter o máximo desempenho do relatório.

Use particionamento de tabela ou refreshincremental

Permite importar dados mais rapidamente e gerenciar conjuntos de dados maiores, especialmente para relatórios muito pequenos, estáticos e sensíveis ao desempenho (menos de 2 segundos).

Adicionar botões Aplicar todos os segmentadores e Limpar todos os segmentadores

Evita consultas desnecessárias aproveitando as configurações de redução de consultas quando os usuários interagem com filtros de relatório.

Use Assumir integridade referencial ao definir relações de tabela se a integridade referencial tiver sido validada na ingestão upstream

Permite estratégias join mais eficientes em consultas SQL .

Ajuste seu modelo de dados

Melhores práticas

Impacto

Documentos

Transformações "Mover para a esquerda"

A visualização SQL aproveita o poder do mecanismo Databricks SQL para uma execução de relatórios mais eficiente em comparação às transformações do PowerQuery e fórmulas DAX.

Se você precisar usar fórmulas DAX, otimize-as e evite grandes conjuntos de resultados.

Evita cálculos ineficientes que levam à deterioração do desempenho

Evite colunas calculadas DAX e tabelas calculadas em modelos semânticos e defina esses dados diretamente em suas tabelas ouro

As medidas pré-calculadas têm melhor desempenho na camada ouro

Para DirectQuery, verifique as configurações de paralelismo de consulta

Melhora a paralelização de consultas e maximiza a utilização do SQL warehouse para melhorar o desempenho geral.

Para DirectQuery, verifique quantas consultas o Power BI pode enviar em paralelo ao Databricks

Garante que o warehouse Databricks SQL seja dimensionado adequadamente para lidar com o nível necessário de paralelismo para evitar que as consultas sejam enfileiradas, resultando em um relatório lento.

Monitore o desempenho e as métricas

Melhores práticas

Impacto

Documentos

Use Power BI Performance Analyzer para examinar o desempenho dos elementos do relatório

Identifica a visualização que leva mais tempo para carregar e onde está o gargalo.

Avalie as seguintes propriedades dos modelos semânticos do Power BI: - Máximo de conexões por fonte de dados - Número máximo de avaliações simultâneas - Número máximo de empregos concorrentes - MaxParallelismPerQuery

Ajusta o desempenho do modelo.