Importar e consultar uso de dados com o suplemento Databricks Excel
Visualização
Este recurso está em Pré-visualização Pública.
O suplemento Databricks Excel conecta seu workspace Databricks ao Microsoft Excel, trazendo dados de gestão de casas à beira de lagos diretamente para suas planilhas, ajudando você a transformar dados em decisões mais rapidamente.
Esta página descreve como usar o suplemento Databricks para Excel para importar e analisar dados do Databricks no Excel. Você pode navegar e importar tabelas do Databricks por meio de uma interface intuitiva, sem necessidade de conhecimento em SQL. Embora o complemento ofereça a flexibilidade de executar consultas SQL personalizadas, isso é opcional.
Pré-requisitos
Antes de usar o suplemento do Excel, verifique se ele está configurado corretamente.
Selecione um SQL warehouse
Escolha qual SQL warehouse usar:
- No canto superior direito do painel do suplemento Databricks no Excel, clique no menu suspenso.
- Selecione qual SQL warehouse você deseja usar.
Importar dados do Databricks
Importe dados do Databricks para o Excel selecionando uma tabela, escrevendo uma consulta SQL ou importando uma tabela dinâmica.
Você pode importar a visualização de métricas Unity Catalog usando tabelas dinâmicas, consultas SQL e funções personalizadas.
Criar tabelas dinâmicas
Para criar uma tabela dinâmica a partir das tabelas Unity Catalog e visualizá-la no Excel:
-
No painel do suplemento Databricks para Excel , na tab Nova importação , selecione Selecionar dados como o método de importação .
-
Em Catálogo , selecione a tabela a partir da qual deseja criar uma tabela dinâmica e clique em Selecionar .
-
Selecione a caixa de seleção "Dados dinâmicos" .
-
Configure suas linhas , colunas , valores e filtros conforme necessário.
-
(Opcional) Para ver um exemplo da importação, clique em Visualizar .
-
(Opcional) Defina um limite de linhas para sua importação.
-
Clique em Importar resultados .
As tabelas dinâmicas só podem ser importadas para uma nova planilha.
Ao trabalhar com métricas do Unity Catalog em tabelas dinâmicas, você pode ver Sum(measure) exibido nos resultados. Este é o comportamento esperado e nenhuma agregação adicional ocorre. O Excel exige que os valores tenham uma função de agregação, mas como os dados contêm valores únicos, nenhuma agregação ocorre.
Selecionar tabelas
Os dados são importados como um objeto de tabela do Excel. Você pode mover a tabela ou renomear a planilha, e o suplemento Excel atualizará os dados no novo local.
Para importar dados de uma tabela do Databricks, faça o seguinte:
- No painel do suplemento Databricks para Excel , na tab Nova importação , selecione Selecionar dados como o método de importação .
- Selecione uma tabela para importar no explorador de catálogo. Você pode filtrar o catálogo por proprietário, status de certificação e outras propriedades usando
filtro.
- Clique em Selecionar .
- Em Colunas , clique na seta e desmarque as colunas que não deseja importar ou deixe todas as colunas selecionadas para importar a tabela inteira.
- (Opcional) Para definir filtros, clique em + ao lado de Filtros , selecione a coluna à qual deseja aplicar um filtro e, em seguida, insira a condição do filtro.
- (Opcional) Para ver um exemplo da importação, clique em Visualizar .
- (Opcional) Você pode definir um limite de linhas para restringir o número de linhas importadas.
- (Opcional) Para identificar facilmente os dados importados, você pode inserir um nome para a importação .
- Em Destino de Saída , escolha importar os dados para uma nova planilha ou para a planilha atual. Se você importar para a planilha atual, os dados começarão na célula selecionada.
- Clique em Importar resultados .
Escreva consultas SQL
O método de importação Write SQL oferece suporte a funções SQL e procedimentos armazenados.
Para executar consultas SQL personalizadas em seu workspace Databricks , faça o seguinte:
-
No painel do suplemento Databricks para Excel , na tab Nova importação , selecione Escrever SQL como o método de importação .
-
Insira um nome para sua consulta para identificá-la posteriormente.
-
Escreva uma nova consulta ou utilize uma consulta existente do seu workspace Databricks .
-
Escreva sua consulta SQL no editor. Você pode consultar qualquer tabela no Unity Catalog à qual você tenha permissão de acesso.
- Clique
Explore o catálogo para view seus esquemas e tabelas.
- Clique
-
Para usar uma consulta do seu workspace Databricks ou uma consulta existente no Excel, clique em
a pasta. Se você usar uma consulta existente do seu workspace Databricks , as edições feitas no Excel não serão refletidas no Databricks.
-
-
(Opcional) Para adicionar parâmetros de consulta, clique em +Adicionar ao lado de Parâmetros . Clique no parâmetro para especificar o Nome do Parâmetro e o Valor do Parâmetro .
-
Em Destino de Saída , escolha importar os dados para uma nova planilha ou para a planilha atual. Se você importar para a planilha atual, os dados começarão na célula selecionada.
-
Para pré-visualizar os resultados da sua consulta, clique em execução .
-
Clique em Importar resultados .
Você também pode usar funções personalizadas para adicionar parâmetros de consulta. Consulte Escrever SQL.
Utilize funções personalizadas no Excel
O suplemento para Excel fornece funções personalizadas que você pode usar em fórmulas do Excel para importar dados do Databricks.
Selecione uma tabela
A função DATABRICKS.Table importa dados de uma tabela Unity Catalog .
Sintaxe:
=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])
Parâmetros:
catalog_name.schema_name.table_name(Obrigatório): O nome completo da tabela.columns(opcional): Uma matriz de nomes de colunas para importar. Omita este parâmetro para importar todas as colunas.limit(opcional): O número máximo de linhas a importar. Omita este parâmetro para importar todas as linhas, até o limite de 10 MB.
Exemplo:
=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)
Esta fórmula importa as colunas customer_id e customer_name da tabela main.default.customers , limitada a 100 linhas.
Escreva SQL
A função DATABRICKS.SQL executa uma consulta SQL que usa parâmetros de consulta e retorna os resultados.
Sintaxe:
Especifique os parâmetros usando valores.
=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})
Especifique os parâmetros usando um intervalo de células. Os parâmetros de nome e valor devem ser definidos em células que estejam na mesma linha.
=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})
Parâmetros:
query_text(Obrigatório): A consulta SQL a ser executada.parameters(Obrigatório): Um mapeamento dos valores dos parâmetros a serem substituídos na consulta.
Exemplo:
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)
Esta fórmula executa uma consulta que filtra os dados de vendas por longitude e latitude, usando os valores de parâmetro fornecidos.
registrar consultas
Gerencie suas importações existentes na página Importações.
Editar uma importação existente
Para editar uma importação existente:
- No painel do suplemento Databricks no Excel, clique na tab Importações .
- Localize a importação que deseja editar.
- Clique no menu de três pontos ao lado de "Importar".
- Clique em Editar para editar sua importação.
atualizar dados
O suplemento Excel não refresh automaticamente os dados importados. Para atualizar seus dados com os valores mais recentes do Databricks:
-
Para refresh uma única importação, faça o seguinte:
- No painel do suplemento Databricks no Excel, clique na tab Importações .
- Clique
refresh ao lado da importação que deseja refresh.
-
Para refresh todas as importações, faça o seguinte:
- Clique em "Atualizar tudo" no painel do suplemento Databricks .
O suplemento executa novamente a consulta original ou a seleção da tabela e atualiza sua planilha com os dados atualizados.
Ao atualizar os dados, o suplemento do Excel limpa todos os dados existentes na tabela especificada e recarrega os dados mais recentes do Databricks. Quaisquer colunas personalizadas que você tenha adicionado à tabela serão excluídas durante o processo refresh .
compartilhamento implicações
Ao compartilhar uma pasta de trabalho do Excel que contenha dados do Databricks, considere as seguintes implicações de acesso e segurança de dados:
Visibilidade dos dados importados
Quando um destinatário atualiza uma importação, o Add-in usa as permissões Unity Catalog do destinatário. Se eles não tiverem acesso aos dados subjacentes, a refresh falhará.
Para pastas de trabalho onde a privacidade dos dados é uma preocupação, você pode usar a seguinte solução alternativa:
- Crie uma planilha com todas as fórmulas e importações necessárias.
- Exclua os dados importados da planilha.
- Compartilhe a apostila com o destinatário.
- Peça ao destinatário refresh os dados.
O destinatário vê apenas os dados aos quais tem acesso com base nas suas permissões Unity Catalog .
Acesso ao espaço de trabalho e aos dados ativos
- Usuários sem acesso aos objetos Unity Catalog referenciados na planilha não podem refresh os dados. Para refresh os dados, os usuários devem ter permissões de leitura nas tabelas subjacentes e na visualização no Unity Catalog.
- Os usuários precisam ter acesso à tabela subjacente no Databricks para editar as importações existentes.
Visibilidade da consulta
Usuários com permissão de edição na planilha podem view as consultas usadas para gerar os dados por meio do complemento Databricks , mesmo que não tenham acesso aos dados subjacentes no Unity Catalog.
Limitações
- Funções personalizadas : Para funções personalizadas, os resultados da consulta são limitados a 25 MiB devido às limitações da API de execução SQL.