Pular para o conteúdo principal

O que é Lakebase?

info

Visualização

Esse recurso está em Public Preview nas seguintes regiões: us-east-1, us-west-2, eu-west-1, ap-southeast-1, ap-southeast-2, eu-central-1, us-east-2, ap-south-1.

Esta página apresenta o Databricks Lakebase, um mecanismo de banco de dados OLTP Postgres totalmente gerenciado, integrado à Databricks Data Intelligence Platform. Uma instância de banco de dados é um tipo de Databricks compute que fornece o armazenamento e compute para executar um servidor Postgres que gerencia vários bancos de dados.

Visão geral

Um banco de dados de processamento de transações on-line (OLTP) é um tipo especializado de sistema de banco de dados projetado para lidar eficientemente com grandes volumes de dados transacionais em tempo real. O Lakebase permite que o senhor crie um banco de dados OLTP no site Databricks e integre cargas de trabalho OLTP à sua Lakehouse. Esse banco de dados OLTP permite que o senhor crie e gerencie bancos de dados armazenados no armazenamento Databricks-gerenciar.

O uso de um banco de dados OLTP em conjunto com a plataforma Databricks reduz significativamente a complexidade do aplicativo. O Lakebase é bem integrado ao gerenciamento de recursos, ao SQL warehouse e ao Databricks Apps. O uso de tabelas de sincronização fornece uma maneira simples e eficiente de sincronizar dados entre cargas de trabalho OLTP e de processamento analítico on-line (OLAP).

Baseado no Postgres e totalmente integrado à Databricks Data Intelligence Platform, o Lakebase herda vários recursos essenciais da plataforma, incluindo

  • Gerenciamento simplificado: Aproveita a infraestrutura Databricks existente para implantar instâncias com compute e armazenamento desacoplados, gerenciar a captura de dados de alterações (CDC) com Delta Lakee suporte para implantações em várias nuvens.
  • Recursos integrados de inteligência artificial (AI) e aprendizado de máquina (ML): Suporta recurso e modelo servindo, geração aumentada por recuperação (RAG) e outras integrações AI e ML.
  • Autenticação e governança integradas: Opcionalmente, use o Unity Catalog para impor o acesso seguro aos dados.

Exemplos de casos de uso

Os exemplos a seguir mostram como organizações de diferentes setores usam as integrações do Databricks para a tomada de decisões em tempo real e a automação do fluxo de trabalho:

  • Comércio eletrônico: Use segmentos de clientes pré-calculados e análises para dar suporte ao fluxo de trabalho, como entrega preferencial, direcionamento de ofertas e recomendações personalizadas de produtos.
  • Saúde: gerenciar dados de estudos clínicos e trazer à tona percepções relevantes por meio de sistemas de recomendação incorporados ao fluxo de trabalho clínico.
  • Serviço financeiro: Permitir a negociação automática do mercado com base em dados de transmissão e modelos pré-treinados.
  • Varejo: Use um chatbot que incorpore o histórico de conversas recentes e dados de tempo real (por exemplo, o conteúdo do carrinho de compras) para personalizar as respostas e impulsionar o engajamento.
  • Fabricação: Rastreie e gerencie dados de telemetria de máquinas e IoT para apoiar a tomada de decisões de baixa latência e o fluxo de trabalho de manutenção automatizada.

Tipos de carga de trabalho

  • Servidor de dados: forneça dados analíticos com baixa latência aos aplicativos.
  • Armazenar o estado do aplicativo: gerenciar seu estado de fluxo de trabalho em nosso armazenamento de dados transacionais.
  • Feature Serving: Servir dados caracterizados em uma baixa latência para os modelos.

Integração com o Databricks

Os recursos a seguir oferecem suporte à integração do PostgreSQL com a Databricks.

Feature Serving

  • Integração da loja de recursos on-line: Use as tabelas do PostgreSQL como um armazenamento on-line para o tempo real Feature Serving. Consulte Databricks Online recurso Stores.
Esse artigo foi útil?