O que é Lakebase?
Visualização
Esse recurso está em Public Preview nas seguintes regiões: us-east-1
, us-west-2
, eu-west-1
, ap-southeast-1
, ap-southeast-2
, eu-central-1
, us-east-2
, ap-south-1
.
Esta página apresenta o Databricks Lakebase, um mecanismo de banco de dados OLTP Postgres totalmente gerenciado, integrado à Databricks Data Intelligence Platform. Uma instância de banco de dados é um tipo de Databricks compute que fornece o armazenamento e compute para executar um servidor Postgres que gerencia vários bancos de dados.
Visão geral
Um banco de dados de processamento de transações on-line (OLTP) é um tipo especializado de sistema de banco de dados projetado para lidar eficientemente com grandes volumes de dados transacionais em tempo real. O Lakebase permite que o senhor crie um banco de dados OLTP no site Databricks e integre cargas de trabalho OLTP à sua Lakehouse. Esse banco de dados OLTP permite que o senhor crie e gerencie bancos de dados armazenados no armazenamento Databricks-gerenciar.
O uso de um banco de dados OLTP em conjunto com a plataforma Databricks reduz significativamente a complexidade do aplicativo. O Lakebase é bem integrado ao gerenciamento de recursos, ao SQL warehouse e ao Databricks Apps. O uso de tabelas de sincronização fornece uma maneira simples e eficiente de sincronizar dados entre cargas de trabalho OLTP e de processamento analítico on-line (OLAP).
Baseado no Postgres e totalmente integrado à Databricks Data Intelligence Platform, o Lakebase herda vários recursos essenciais da plataforma, incluindo
- Gerenciamento simplificado: Aproveita a infraestrutura Databricks existente para implantar instâncias com compute e armazenamento desacoplados, gerenciar a captura de dados de alterações (CDC) com Delta Lakee suporte para implantações em várias nuvens.
- Recursos integrados de inteligência artificial (AI) e aprendizado de máquina (ML): Suporta recurso e modelo servindo, geração aumentada por recuperação (RAG) e outras integrações AI e ML.
- Autenticação e governança integradas: Opcionalmente, use o Unity Catalog para impor o acesso seguro aos dados.
Exemplos de casos de uso
Os exemplos a seguir mostram como organizações de diferentes setores usam as integrações do Databricks para a tomada de decisões em tempo real e a automação do fluxo de trabalho:
- Comércio eletrônico: Use segmentos de clientes pré-calculados e análises para dar suporte ao fluxo de trabalho, como entrega preferencial, direcionamento de ofertas e recomendações personalizadas de produtos.
- Saúde: gerenciar dados de estudos clínicos e trazer à tona percepções relevantes por meio de sistemas de recomendação incorporados ao fluxo de trabalho clínico.
- Serviço financeiro: Permitir a negociação automática do mercado com base em dados de transmissão e modelos pré-treinados.
- Varejo: Use um chatbot que incorpore o histórico de conversas recentes e dados de tempo real (por exemplo, o conteúdo do carrinho de compras) para personalizar as respostas e impulsionar o engajamento.
- Fabricação: Rastreie e gerencie dados de telemetria de máquinas e IoT para apoiar a tomada de decisões de baixa latência e o fluxo de trabalho de manutenção automatizada.
Tipos de carga de trabalho
- Servidor de dados: forneça dados analíticos com baixa latência aos aplicativos.
- Armazenar o estado do aplicativo: gerenciar seu estado de fluxo de trabalho em nosso armazenamento de dados transacionais.
- Feature Serving: Servir dados caracterizados em uma baixa latência para os modelos.
Integração com o Databricks
Os recursos a seguir oferecem suporte à integração do PostgreSQL com a Databricks.
Feature Serving
- Integração da loja de recursos on-line: Use as tabelas do PostgreSQL como um armazenamento on-line para o tempo real Feature Serving. Consulte Databricks Online recurso Stores.