Conecte-se ao Looker
Este artigo descreve como usar o Looker com clusters Databricks ou Databricks SQL warehouse (anteriormente Databricks SQL endpoint).
Importante
Quando tabelas derivadas persistentes (PDTs) estão habilitadas, por default , o Looker gera novamente PDTs a cada 5 minutos conectando-se ao banco de dados associado. Databricks recomenda que você altere a frequência default para evitar incorrer em custos compute em excesso. Para obter mais informações, consulte Ativar e gerenciar tabelas derivadas persistentes (PDTs).
Requisitos
Antes de se conectar ao Looker manualmente, você precisa do seguinte:
Um clusters ou SQL warehouse em seu workspace do Databricks.
Os detalhes de conexão para seus clusters ou SQL warehouse, especificamente os valores Server hostname, Port e HTTP Path .
Um Databricks pessoal access token. Para criar um access token pessoal, siga os passos em Databricks access tokens pessoal para usuários do workspace .
Observação
Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.
Se o senhor usar a autenticação pessoal access token, a Databricks recomenda o uso de pessoal access tokens pertencente à entidade de serviço em vez de usuários workspace. Para criar o site tokens para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
Conectar-se ao Looker manualmente
Para se conectar ao Looker manualmente, faça o seguinte:
No Looker, clique em Admin > Conexões > Adicionar conexão.
Insira um Nome exclusivo para a conexão.
Dica
Os nomes de conexão devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem causar resultados inesperados posteriormente.
Para Dialeto, selecione Databricks.
Para Host Remoto, insira o hostnamedo servidor dos requisitos.
Para Porta, insira a Porta dos requisitos.
Para Banco de dados, insira o nome do banco de dados no workspace que deseja acessar por meio da conexão (por exemplo,
default
).Para Nome de usuário, insira a palavra
token
.Para Senha, insira seus access tokens pessoal dos requisitos.
Para Parâmetros Adicionais, insira
transportMode=http;ssl=1;httpPath=<http-path>
, substituindo<http-path>
pelo valor do Caminho HTTP dos requisitos.Se Unity Catalog estiver habilitado para seu workspace, defina adicionalmente um catálogo default . Insira
ConnCatalog=<catalog-name>
, substituindo<catalog-name>
pelo nome de um catálogo.Para PDT And Datagroup Maintenance programar, insira uma expressão
cron
válida para alterar a frequência default para regenerar PDTs. A frequência default é a cada cinco minutos.Se você quiser traduzir query para outros fusos horários, ajuste o fuso horárioquery .
Para os restantes campos manter o default, nomeadamente:
Mantenha o default Max Connections e Connection pool Timeout .
Deixe o fuso horário do banco de dados em branco (supondo que você esteja armazenando tudo em UTC).
Clique em Testar essas configurações.
Se o teste for bem-sucedido, clique em Adicionar conexão.
Modele seu banco de dados no Looker
Esta seção cria um projeto e executa o gerador. Os passos a seguir assumem que existem tabelas permanentes armazenadas no banco de dados para sua conexão.
No menu Revelação , ative o Modo de Desenvolvimento.
Clique em Desenvolver > Gerenciar Projetos LookML.
Clique em Novo projeto LookML.
Digite um nome de projeto exclusivo.
Dica
Os nomes dos projetos devem conter apenas letras minúsculas, números e sublinhados. Outros caracteres podem ser aceitos, mas podem produzir resultados inesperados posteriormente.
Para Connection, selecione o nome da conexão da passo 2.
Para Schemas, insira
default
, a menos que você tenha outros bancos de dados para modelar por meio da conexão.Para os restantes campos manter o default, nomeadamente:
Deixe o Ponto de partida definido como Gerar modelo a partir do esquema do banco de dados.
Deixe view Build From definida como All Tables.
Clique em Criar projeto.
Depois de criar o projeto e a execução do gerador, o Looker exibe uma interface de usuário com um arquivo .model
e vários arquivos .view
. O arquivo .model
mostra as tabelas no esquema e quaisquer relações join descobertas entre elas, e os arquivos .view
listam cada dimensão (coluna) disponível para cada tabela no esquema.
Próximos passos
Para começar a trabalhar com seu projeto, consulte os seguintes recursos no site do Looker:
Habilitar e gerenciar tabelas derivadas persistentes (PDTs)
O Looker pode reduzir os tempos query e as cargas do banco de dados criando tabelas derivadas persistentes (PDTs). Um PDT é uma tabela derivada que o Looker grava em um esquema temporário em seu banco de dados. O Looker então regenera o PDT no programar que você especificar. Para obter mais informações, consulte Tabelas derivadas persistentes (PDTs) na documentação do Looker.
Para habilitar PDTs para uma conexão de banco de dados, selecione Tabelas Derivadas Persistentes para essa conexão e conclua as instruções na tela. Para obter mais informações, consulte Tabelas derivadas persistentes e Configuração de credenciais de login separadas para processos PDT na documentação do Looker.
Quando os PDTs estão ativados, por default , o Looker regenera os PDTs a cada 5 minutos conectando-se ao banco de dados associado. O Looker reinicia o recurso Databricks associado se ele for interrompido. Databricks recomenda que você altere a frequência default definindo o campo programar PDT And Datagroup Maintenance para sua conexão de banco de dados para uma expressão cron
válida. Para obter mais informações, consulte PDT and Datagroup Maintenance programar na documentação do Looker.
Para habilitar PDTs ou alterar a frequência de regeneração de PDT para uma conexão de banco de dados existente, clique em Admin > Conexões de banco de dados, clique em Editar ao lado de sua conexão de banco de dados e siga as instruções anteriores.