Acesse e trabalhe com uma instância de banco de dados
Visualização
Esse recurso está em Public Preview nas seguintes regiões: us-east-1
, us-west-2
, eu-west-1
, ap-southeast-1
, ap-southeast-2
, eu-central-1
, us-east-2
, ap-south-1
.
Esta página descreve as diferentes maneiras de trabalhar com a instância do banco de dados do Lakebase e recomenda como otimizar as consultas do PostgreSQL.
Formas de acessar seu banco de dados
Veja a seguir os métodos para acessar a instância do seu banco de dados para executar PostgreSQL consultas e gerenciar identidades. Como um serviço de gerenciar Postgres, há algumas limitações de funcionalidade. Veja a compatibilidade do Postgres.
Método | Descrição |
---|---|
Conecte-se ao seu banco de dados e consulte-o no editor Databricks SQL. | |
Conecte-se ao seu banco de dados e faça consultas a partir do Databricks Notebook. | |
Conecte-se ao seu banco de dados e faça consultas a partir de ferramentas externas, como |
Se o senhor consultar por meio de um Databricks SQL endpoint, a consulta será federada a uma instância do banco de dados.
Otimize as consultas
A extensão pg_stat_statements
fornece informações detalhadas sobre o desempenho da consulta para ajudar a identificar consultas lentas e otimizá-las.
Os usuários podem ver os textos de consulta de suas consultas e quaisquer funções das quais herdam privilégios. Se você tem o privilégio ADMIN
em uma função e não consegue ver os textos de consulta dessa função, conceda a si mesmo a participação nessa função. Se você não tiver privilégios em uma função, não poderá ver seus textos de consulta por motivos de segurança.
Sincronizar uma tabela do Unity Catalog com o Postgres
A sincronização de uma tabela Unity Catalog no Postgres permite consultas de leitura de baixa latência e oferece suporte à união em tempo de consulta com outras tabelas do Postgres.
principais considerações:
- Atualização de dados: O modo de sincronização contínua atualiza os dados da tabela gerenciadora Unity Catalog para a tabela sincronizada em um intervalo mínimo de 15 segundos.
- Taxa de atualização: O pipeline de sincronização suporta gravações contínuas de aproximadamente 1.200 linhas por segundo por Unidade de Capacidade (CU) e gravações em massa de até 15.000 linhas por segundo por CU.
- Limite de tamanho de tabela: cada tabela sincronizada pode ter até 2 TB. Se o senhor precisar de atualização em vez de recriação completa da tabela, o limite será de 1 TB.
Use consultas federadas via DBSQL
Use consultas federadas via DBSQL para consultar sua tabela Postgres sem sincronizar seus dados.
principais considerações:
- Latência: As consultas federadas têm maior latência do que as consultas diretas do PostgreSQL.
- Taxa de transferência: O Databricks SQL suporta menos consultas por segundo (QPS) em comparação com a consulta direta ao PostgreSQL.
- Otimização de consultas: Para obter o melhor desempenho, escreva consultas que filtrem no site primário key ou em uma coluna indexada da tabela Postgres.