Folha de dicas do Power BI
Esta página fornece orientações claras e opinativas para gerenciar seus dados de forma eficiente no Power BI e no Databricks para otimizar o desempenho das consultas e criar painéis eficientes.
Conectar Databricks e Power BI
Melhores práticas | Impacto | Documentos |
---|---|---|
Use parâmetros do Power BI ao conectar-se a diferentes ambientes do Databricks | Permite flexibilidade ao conectar-se a diferentes espaços de trabalho Databricks ou diferentes armazéns Databricks SQL . | |
Use a funcionalidade de publicação do serviço do Power BI do Databricks | Permite integração perfeita de catálogos e sincronização de modelos de dados sem sair da interface do usuário do Databricks. | |
Use a publicação automática do Databricks no Power BI | Publique o conjunto de dados do Unity Catalog no Power BI diretamente do pipeline de dados. |
Escolha o modo de armazenamento mais apropriado
Melhores práticas | Impacto | Documentos |
---|---|---|
Use DirectQuery para tabelas de fatos e Dual para tabelas de dimensões (não Importar) | Gere consultas SQL mais eficientes usando o modo de armazenamento mais adequado. | |
Prefira DirectQuery em vez de Import sempre que possível | Permite que você mantenha a governança e a audibilidade. | |
Use modelos compostos para modos de armazenamento mistos | Permite o uso misto de tabelas DirectQuery, Dual, modo de importação e tabelas de agregação e híbridas. | |
Utilize tabelas híbridas para dados históricos agregados com dados tempo-real | Permite consultas eficientes na memória. |
Otimizar o acesso aos dados
Melhores práticas | Impacto | Documentos |
---|---|---|
Use agregações definidas pelo usuário | Melhora o desempenho da consulta em grandes modelos semânticos do DirectQuery armazenando em cache dados pré-agregados. | |
Usar agregações automáticas | Otimiza continuamente os modelos semânticos do DirectQuery criando agregações com base no Query History para obter o máximo desempenho do relatório. | |
Use particionamento de tabela ou refreshincremental | Permite importar dados mais rapidamente e gerenciar conjuntos de dados maiores, especialmente para relatórios muito pequenos, estáticos e sensíveis ao desempenho (menos de 2 segundos). | |
Adicionar botões Aplicar todos os segmentadores e Limpar todos os segmentadores | Evita consultas desnecessárias aproveitando as configurações de redução de consultas quando os usuários interagem com filtros de relatório. | |
Use Assumir integridade referencial ao definir relações de tabela se a integridade referencial tiver sido validada na ingestão upstream | Permite estratégias join mais eficientes em consultas SQL . |
Ajuste seu modelo de dados
Melhores práticas | Impacto | Documentos |
---|---|---|
Transformações "Mover para a esquerda" | A visualização SQL aproveita o poder do mecanismo Databricks SQL para uma execução de relatórios mais eficiente em comparação às transformações do PowerQuery e fórmulas DAX. | |
Se você precisar usar fórmulas DAX, otimize-as e evite grandes conjuntos de resultados. | Evita cálculos ineficientes que levam à deterioração do desempenho | |
Evite colunas calculadas DAX e tabelas calculadas em modelos semânticos e defina esses dados diretamente em suas tabelas ouro | As medidas pré-calculadas têm melhor desempenho na camada ouro | |
Para DirectQuery, verifique as configurações de paralelismo de consulta | Melhora a paralelização de consultas e maximiza a utilização do SQL warehouse para melhorar o desempenho geral. | |
Para DirectQuery, verifique quantas consultas o Power BI pode enviar em paralelo ao Databricks | Garante que o warehouse Databricks SQL seja dimensionado adequadamente para lidar com o nível necessário de paralelismo para evitar que as consultas sejam enfileiradas, resultando em um relatório lento. |
Monitore o desempenho e as métricas
Melhores práticas | Impacto | Documentos |
---|---|---|
Use Power BI Performance Analyzer para examinar o desempenho dos elementos do relatório | Identifica a visualização que leva mais tempo para carregar e onde está o gargalo. | |
Avalie as seguintes propriedades dos modelos semânticos do Power BI: - Máximo de conexões por fonte de dados - Número máximo de avaliações simultâneas - Número máximo de empregos concorrentes - MaxParallelismPerQuery | Ajusta o desempenho do modelo. |