Lakehouse em tempo real
Beta
Este recurso está em Beta. Entre em contato com a equipe da sua conta da Databricks para habilitar este recurso em sua conta.
Lakehouse//RT está em desenvolvimento ativo. As características de desempenho e o conjunto de recursos suportados serão alterados antes da disponibilidade geral.
O Lakehouse Tempo Real (Lakehouse//RT) é um compute serverless desenvolvido para casos de uso de baixa latência e alta simultaneidade, como servir dados analíticos para aplicativos personalizados, executar análises operacionais ou alimentar dashboards de BI que exigem respostas em menos de um segundo para centenas a milhares de usuários concorrentes.
Lakehouse//RT oferece latência em microssegundos em consultas de leitura SQL contra suas tabelas do Unity Catalog que usam os formatos Delta Lake ou Apache Iceberg em armazenamento em nuvem. Cria-se e gerencia-se o Lakehouse de forma muito semelhante a outros SQL warehouses. Um administrador do workspace ou usuário privilegiado cria um ou mais por workspace e atribui permissões a usuários.
Requisitos
Para usar o Lakehouse//Tempo Real, é preciso:
- Esteja em uma região compatível.
- Tenha o Lakehouse//RT Beta ativado em seu workspace.
Habilite o Lakehouse//RT em seu workspace
Administradores do workspace podem habilitar o Lakehouse//RT Beta em seu workspace:
- No menu do seu workspace (canto superior direito), vá para **Previews**.
- Pesquise por Lakehouse Tempo Real .
- Ativar a pré-visualização.
Depois de habilitar a pré-visualização, o tipo de SQL warehouse Tempo Real fica disponível no fluxo de criação do SQL warehouse para o seu workspace.
Criar um Lakehouse (warehouse RT)
Para criar um Lakehouse//RT Warehouse:
- Acesse compute > SQL Warehouses > Criar SQL Warehouse .
- Select tempo real .
- Selecione um tamanho: Pequeno , Médio , Grande ou X-Large , dependendo do desempenho que suas consultas exigem.
- Insira um nome para o armazém.
- Clique em Criar .
Para atribuir permissões, conceda **Can use (Pode usar)**, **Can monitor (Pode monitorar)** ou **Can manage (Pode gerenciar)** a usuários e grupos, o mesmo que a um SQL warehouse.
Não é possível fazer upgrade de um SQL warehouse existente para Lakehouse//RT ou fazer downgrade de um warehouse Lakehouse//RT existente para outro tipo de warehouse.
Monitoramento do lakehouse
É possível monitorar consultas lakehouse//RT da mesma forma que qualquer consulta executada em um SQL warehouse.
- Histórico de consultas: as queries Lakehouse//RT aparecem na interface do usuário do histórico de query e na tabela do sistema de histórico de consultas.
- Perfis de query: Abrir uma query Lakehouse//RT na interface do usuário do histórico de query para visualizar seu perfil de query.
- Página de monitoramento: Monitore a taxa de transferência de queries, queries enfileiradas e o histórico de queries na página de monitoramento para cada warehouse Lakehouse/RT.
- Cobrança: A utilização de Lakehouse//RT consta nas tabelas do sistema de cobrança com um
sku_namedeLakehouse_Serverless.
Práticas recomendadas
Para obter os melhores resultados do lakehouse//RT, prepare as suas cargas de trabalho antes de as mover:
- Valide no SQL serverless primeiro. Execute suas consultas em um SQL warehouse serverless e confirme se elas são executadas em alguns segundos.
- Use tabelas gerenciadas do Unity Catalog. Tabelas gerenciadas com otimização preditiva e clustering líquido garantem que seus dados estejam bem agrupados para seus padrões de carga de trabalho.
- Verificar se as consultas são seletivas. Para uma latência inferior a um segundo, verifique se suas consultas leem menores quantidades de dados. Aplique filtros cedo com
WHEREcláusulas, selecione apenas as colunas necessárias e utilize agregações. Há suporte para junção entre tabelas, mas caso a consulta se torne complexa ou lenta, considere usar visualizações materializadas que pré-agregam os dados para latências mais rápidas. - Verifique a cobertura de SQL. Lakehouse//RT suporta somente consultas de leitura compatíveis com ANSI. Confirme que suas cargas de trabalho são compatíveis com ANSI e evite as declarações, funções e tipos de dados não compatíveis listados em Limitações.
Recursos compatíveis
Ferramentas e interfaces
É possível selecionar Lakehouse//RT no seletor de compute em qualquer um dos seguintes recursos do Databricks:
- Editor de SQL
- Notebooks SQL
- Dashboards de IA/BI
- Explorador de Catálogos
- Alertas
Tipos de tabela
Lakehouse//RT consulta apenas dados do Unity Catalog. Para melhor desempenho, utilize tabelas gerenciadas pelo Unity Catalog, que fornecem ao mecanismo a disposição dos dados de que ele precisa para baixa latência.
Lakehouse//RT é compatível com os seguintes tipos de tabela:
- Tabelas gerenciadas (Delta Lake e Apache Iceberg)
- Visualizações materializadas e tabelas de transmissão em fluxo
- Views de métricas
Conectividade
Lakehouse//RT só aceita conexões que usam a API de Execução de Instruções. Não oferece suporte ao protocolo Thrift herdado, portanto, um driver que se conecta sem usar explicitamente a API de Execução de Instruções recebe um erro 501.
É possível conectar-se a um warehouse Lakehouse//RT das seguintes maneiras:
- API de Execução de Instruções: Use a API diretamente de aplicativos externos. Consulte API de Execução de Instruções: Executar SQL em warehouses.
- Drivers do Databricks SQL: Os drivers a seguir podem se conectar quando você os configura para usar a API de Execução de Declarações. Aponte o caminho HTTP do driver para seu warehouse Lakehouse//RT, depois defina a seguinte opção:
- Databricks SQL Connector for Python: Defina
use_kernel=True. - Databricks SQL Driver for Node.js: Defina
useKernel: true. - JDBC: Configure
UseThriftClient=0na URL de conexão.
- Databricks SQL Connector for Python: Defina
preços
Para obter informações sobre preços, consulte a página de preços em tempo real do Lakehouse.
Limitações
Quando uma consulta usa um recurso não compatível, o Lakehouse//RT retorna um erro mencionando o recurso. Para executar a consulta com êxito, tente usar um SQL warehouse serverless em vez disso.
Ferramentas e recursos
Lakehouse//RT não é compatível com os seguintes recursos:
- genie
- Genie Spaces
- Tarefas de jobs
Tipos de tabela
Os seguintes tipos de tabela não são compatíveis durante o Beta:
- System tables
- Tabelas do Delta Sharing
- Tabelas em armazenamento default do Unity Catalog
- Tabelas externas no Unity Catalog
Lakehouse//RT não é compatível com os seguintes tipos de tabela:
- Tabelas do Hive metastore (gerenciadas ou externas)
- Tabelas Externas e Federação de Consultas (Lakehouse Federation)
- Tabelas temporárias
- Tabelas que usam outros formatos de dados (CSV, JSON, Avro, Parquet, ORC e texto)
Conectores e drivers
Lakehouse//RT não oferece suporte aos seguintes drivers e conectores:
- ADBC
- ODBC
- Ir
Linguagem SQL
Lakehouse//RT executa consultas de leitura SQL no modo ANSI apenas.
Lakehouse//RT não suporta os seguintes:
- Tipos de dados: os tipos de dados
GEOGRAPHYeGEOMETRY. - Funções: funções de AI, UDFs de Python, funções SQL espaciais e funções XPath e XML.
- Governança: controle de acesso baseado em atributos (ABAC), incluindo segurança em nível de linha e mascaramento de coluna.
Lakehouse//RT é somente para consultas de leitura (SELECT). Comandos de gravação e ETL não são suportados, incluindo:
- Operações de escrita:
INSERT,UPDATE,DELETE,MERGEeCREATE TABLE AS SELECT(CTAS). - DDL:
CREATE,ALTER,DROP, e outros comandos que criam ou modificam objetos. - Comandos de segurança:
GRANTeREVOKE. - Scripts, procedimentos armazenados, tabelas temporárias e transações com vários comandos.
- Manutenção do Delta Lake:
OPTIMIZE,ANALYZE,VACUUMeREFRESH.
Segurança de rede
Lakehouse//RT não é compatível com as seguintes configurações de rede.
compliance
Perfis de segurança de compliance não são suportados.
Problemas conhecidos
- O Lakehouse//RT aplica verificações de tipo SQL mais rigorosas do que outros tipos de SQL warehouse. Consultas que misturam tipos, como comparar strings e números ou usar
COALESCEcom tipos incompatíveis, podem se comportar de forma diferente ou falhar. Para evitar resultados inesperados, use expressõesCASTexplícitas.