Conecte o Power BI aos Databricks

O Microsoft Power BI é um serviço de análise de negócios que oferece visualizações interativas com recursos de inteligência de Business Intelligence de autoatendimento, permitindo que os usuários criem relatórios e painéis por si mesmos, sem necessidade de depender de pessoal de tecnologia da informação ou administradores de banco de dados.

Quando você utiliza o Databricks como fonte de dados no Power BI, é possível estender os benefícios do desempenho e da tecnologia do Databricks para além dos cientistas de dados e engenheiros de dados, alcançando todos os usuários de negócios.

Publicar no Power BI Online a partir da Databricks

Ao usar o Databricks como fonte de dados com o Power BI Online, o senhor pode criar conjuntos de dados do PowerBI a partir de tabelas ou esquemas diretamente da UI do Databricks.

Requisitos

  • Seus dados devem estar em Unity Catalog, e seu compute (cluster) deve estar habilitado para Unity Catalog. Hive metastore não é suportado no momento.

  • O senhor deve ter uma licença premium (capacidade premium ou licença premium por usuário) do Power BI.

  • O senhor deve ativar "Os usuários podem editar modelos de dados em Power BI serviço (preview)" em workspace settings e Data model settings para editar o modelo semântico depois de publicado. O senhor também pode editar o Semantic Model usando o Tabular Editor, fazendo uma conexão usando o endpoint XMLA.

  • Se o senhor precisar ativar a gravação de XML no PowerBI workspace, siga este link para obter instruções.

  • Se o seu workspace estiver em um link privado, o senhor precisará atualizar manualmente as credenciais do datasource do datasetem Power BI.

Como usá-lo

Publicar tabelas Databricks em um site Power BI dataset

  1. Faça login no site Databricks workspace e navegue até o Catalog Explorer. Selecione o esquema/tabelas a serem publicados. Não selecione em um site Hive metastore ou no catálogo de amostras.

  2. Em compute dropdown, selecione o data warehouse que o senhor deseja usar nesta publicação Power BI.

  3. Com a tabela/esquema desejado a ser publicado aberto no Catalog Explorer, clique no botão "Use with BI tools" (Usar com ferramentas de BI) no canto superior direito.

  4. Na lista dropdown que se abre, clique na opção "Publish to Power BI workspace".

Nesse momento, um menu será aberto no lado direito da janela. Siga as instruções fornecidas pelo menu, detalhadas abaixo:

  1. Clique em "Connect to Microsoft Entra ID" para se autenticar com seu Microsoft account.

  2. No menu a seguir, selecione o site workspace desejado para ser publicado no "Power BI workspace" dropdown. Em "dataset Mode" dropdown, selecione DirectQuery (selecionado por default) ou o modo Import.

  3. Clique no botão azul "Publish to Power BI" (Publicar no Power BI) na parte inferior do menu.

  4. Aguarde a publicação do site dataset. Normalmente, isso leva de 10 a 20 segundos.

  5. Quando o dataset for publicado, o botão azul terá um link com o rótulo "Open Power BI". Clique aqui para abrir seu novo Power BI dataset em um novo tab.

recurso e notas

  • Ao publicar um esquema com várias tabelas, todas as tabelas com colunas serão publicadas. Se nenhuma coluna estiver presente em qualquer tabela, a publicação não será realizada.

  • Os comentários sobre as colunas de uma tabela no Databricks são copiados para as descrições das colunas correspondentes no Power BI.

  • As relações key estrangeiras são preservadas no site publicado dataset. No entanto, o Power BI suporta apenas um caminho de relacionamento ativo entre duas tabelas. Assim, quando vários caminhos estiverem presentes no esquema do Databricks, alguns dos relacionamentos correspondentes no Power BI serão definidos como inativos. O senhor pode alterar posteriormente quais relações estão ativas/inativas no modelo de dados view em Power BI.

  • Um Personal access token (PAT) é criado em seu nome para permitir que o Power BI acesse o modelo semântico. Esse método de autenticação pode ser alterado posteriormente nas configurações da fonte de dados do Power BI.

Conectar o Power BI Desktop ao Databricks

Você pode conectar o Power BI Desktop aos clusters do Databricks SQL warehouses.

Requisitos

  • Power BI Desktop 2.85.681.0 ouacima. Faça o download da versão mais recente. Para utilizar os dados gerenciados pelo Unity Catalog com o Power BI, é necessário usar o Power BI Desktop 2.98.683.0 ouacima (lançamento de outubro de 2021).

    Observação

    O Power BI Desktop requer Windows. Uma alternativa para outros sistemas operacionais é executar o Power BI Desktop em um host físico ou em uma máquina virtual baseada no Windows e, em seguida, conectá-lo a partir do seu sistema operacional.

    Se você usa uma versão do Power BI Desktop abaixo de 2.85.681.0, o senhor também precisa instalar o driver ODBC da Databricks no mesmo ambiente do Power BI Desktop.

  • Um dos seguintes para autenticar:

    • (Recomendado) Power BI habilitado como um aplicativo OAuth em sua account. Isso está habilitado por default.

    • Um access tokenpessoal do Databricks.

      Observação

      Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.

      Se utilizar a autenticação access token pessoal, a Databricks recomenda a utilização access token pessoal pertencente à entidade de serviço em vez de utilizadores workspace . Para criar tokens para entidades de serviço, consulte gerenciar tokens para uma entidade de serviço.

    • Um nome de usuário do Databricks (normalmente seu endereço de e-mail) e senha.

      A autenticação de nome de usuário e senha poderá ser desabilitada se seu workspace do Databricks estiver habilitado para logon único (SSO).

  • Um cluster do Databricks ou Databricks SQL warehouse.

Conecte o Power BI Desktop ao Databricks usando o Partner Connect

Você pode usar o Partner Connect para se conectar a um cluster ou SQL warehouse a partir do Power BI Desktop em apenas alguns cliques.

  1. Certifique-se de que sua account Databricks, workspace e o usuário conectado atendam aos requisitos para Partner Connect.

  2. Na barra lateral, clique em Botão Conexão do parceiro parceiros Conectar.

  3. Clique no bloco Power BI.

  4. Na caixa de diálogo Conectar-se a parceiros , para compute, escolha o nome do recurso compute do Databricks que você deseja conectar.

  5. Escolha Fazer download do arquivo de conexão.

  6. Abra o arquivo de conexão baixado, que inicia o Power BI Desktop.

  7. No Power BI Desktop, insira suas credenciais de autenticação:

    • Token de acesso pessoal: insira seu token de acesso pessoal do Databricks.

    • Nome de usuário / senha: digite seu nome de usuário do Databricks (normalmente seu endereço de e-mail) e senha. A autenticação de nome de usuário e senha pode ser desabilitada se o workspace do Databricks estiver habilitado para logon único (SSO). Se você não conseguir fazer login usando seu nome de usuário e senha do Databricks, tente usar a opção Token de Acesso Pessoal .

    • ID de entrada da Microsoft: Não aplicável.

  8. Clique em Conectar.

  9. Selecione os dados do Databricks a serem consultados no Power BI Navigator.

    Navegador do Power BI

Conectar o Power BI Desktop ao Databricks manualmente

Siga estas instruções, dependendo do método de autenticação escolhido, para se conectar a clusters ou SQL warehouse com o Power BI Desktop. Os armazéns Databricks SQL são recomendados ao usar o Power BI no modo DirectQuery .

Observação

Para se conectar mais rapidamente com o Power BI Desktop, use Partner Connect.

  1. Obtenha o hostname do servidor e o caminho HTTP.

  2. Inicie o Power BI Desktop.

  3. Clique em Obter dados ou Arquivo > Obter dados.

  4. Clique em Obter dados para começar.

  5. Pesquise Databricks e clique no conector:

    • Azure Databricks, se você autenticar usando um token de acesso pessoal ou seu nome de usuário e senha do Databricks.

      Observação

      Embora o nome do conector seja Azure Databricks, ele funciona com Databricks on AWS.

    • Databricks (Beta), se você autenticar usando OAuth.

  6. Clique em Conectar.

  7. Insira o Nome de host do servidor e o Caminho HTTP.

  8. Selecione seu modo de conectividade de dados. Para obter informações sobre a diferença entre Importar e DirectQuery, consulte Usar DirectQuery no Power BI Desktop.

  9. Clique em OK.

  10. Clique no seu método de autenticação:

    • Nome de usuário/senha: insira seu nome de usuário e senha do Databricks. A autenticação de nome de usuário e senha pode ser desativada se o workspace do Databricks estiver ativado para logon único (SSO). Se não conseguir fazer login usando seu nome de usuário e senha da Databricks, tente usar a opção Personal Access Token.

    • Token de acesso pessoal: insira seu token de acesso pessoal.

    • OAuth: clique em Entrar. Uma janela do navegador é aberta e solicita que você faça login com seu IdP. Depois que a mensagem de sucesso for exibida, saia do navegador e retorne ao Power BI Desktop.

  11. Clique em Conectar.

  12. Selecione os dados do Databricks a serem consultados no Power BI Navigator. Se o Unity Catalog estiver habilitado para o seu espaço de trabalho, selecione um catálogo antes de escolher um esquema e uma tabela.

    Navegador do Power BI

Usando uma consulta SQL personalizada

O conector Databricks fornece a fonte de dados Databricks.Query que permite que um usuário forneça uma consulta SQL personalizada.

  1. Siga os passos descritos em Conectar com o Power BI Desktop para criar uma conexão, usando Importar como o modo de conectividade de dados.

  2. No Navegador, clique com o botão direito do mouse no item mais superior que contém o nome do host e o caminho HTTP selecionados e clique em Transformar Dados para abrir o Editor do Power Query.

    Clique em Transformar Dados no Navegador
  3. Na barra de função, substitua o nome da função Databricks.Catalogs por Databricks.Query e aplique a alteração. Isso cria uma função do Power Query que usa uma consulta SQL como parâmetro.

  4. Insira a consulta SQL desejada no campo de parâmetro e clique em Invocar. Isso executa a consulta e uma nova tabela é gerada com os resultados da consulta como seu conteúdo.

Detecção automatizada de proxy HTTP

O Power BI Desktop versão 2.104.941.0e acima (versão de maio de 2022) tem suporte integrado para detectar a configuração de proxy HTTP em todo o sistema Windows. Faça o download da versão mais recente.

O Power BI Desktop pode detectar e usar automaticamente a configuração de proxy HTTP em todo o sistema Windows.

Se o servidor proxy não fornecer um ponto de distribuição CRL (CDP), o Power BI poderá mostrar a seguinte mensagem de erro:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Para corrigir esse erro, execute os passos a seguir:

  1. Crie o arquivo C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini se ele não existir.

  2. Adicione a seguinte configuração ao seu arquivo microsoft.sparkodbc.ini:

    [Driver]
    CheckCertRevocation=0
    

Conector de Compartilhamento Delta do Power BI

Com o conector Power BI Delta Sharing, os usuários podem descobrir, analisar e visualizar conjuntos de dados compartilhados com eles por meio do protocolo Delta Sharing. O protocolo permite a troca segura de conjuntos de dados entre produtos e plataformas, aproveitando o REST e o armazenamento em nuvem.

Para obter instruções de conexão, consulte Power BI: ler dados compartilhados.

Limitações

  • O conector Databricks suporta proxy da Web. No entanto, as configurações automáticas de proxy definidas em .pac arquivos não são suportados.

  • No conector Databricks, a fonte de dados Databricks.Query não é suportada em combinação com o modo DirectQuery.

  • Os dados que o conector Delta Sharing carrega devem caber na memória da sua máquina. Para garantir isso, o conector limita o número de linhas importadas ao Limite de linha definido anteriormente.

Recursos adicionais

Suporte