LakeFlow Connect

Prévia

O LakeFlow Connect está em um Public Preview fechado. Para participar da pré-visualização, entre em contato com a equipe do Databricks account .

Este artigo apresenta uma visão geral do Databricks LakeFlow Connect, que oferece conectores integrados para a ingestão de dados de aplicativos e bancos de dados corporativos.

O que é o LakeFlow Connect?

Databricks LakeFlow O Connect oferece conectores integrados para ingestão de aplicativos e bancos de dados corporativos. A ingestão resultante pipeline é governada por Unity Catalog e é alimentada por serverless compute e Delta Live Tables.

O LakeFlow Connect utiliza leituras e gravações incrementais eficientes para tornar a ingestão de dados mais rápida, dimensionável e econômica, enquanto seus dados permanecem atualizados para consumo downstream.

Componentes do conector SaaS

Um conector SaaS é modelado pelos seguintes componentes:

  • Conexão: Um objeto seguro do Unity Catalog que armazena detalhes de autenticação para o banco de dados.

  • Ingestão pipeline: Ingere os dados em etapas nas tabelas Delta. Esse componente é modelado como um serverless DLT pipeline.

Diagrama de componentes do conector SaaS

Componentes do conector de banco

Um conector de banco de dados é modelado pelos seguintes componentes:

  • Conexão: Um objeto seguro do Unity Catalog que armazena detalhes de autenticação para o banco de dados.

  • Gateway: extração de dados do banco de dados de origem e mantém a integridade das transações durante a transferência. Para bancos de dados baseados em cloud, o gateway é configurado como um DLT pipeline com o clássico compute.

  • Armazenamento de preparação: Um volume do Unity Catalog em que os dados do gateway são preparados antes de serem aplicados a uma tabela Delta. O armazenamento de preparação account é criado quando o gateway é implantado e existe no catálogo e no esquema que o senhor especificar.

  • Ingestão pipeline: Ingere os dados em etapas nas tabelas Delta. Esse componente é modelado como um serverless DLT pipeline.

Diagrama de componentes do conector de

LakeFlow Connect vs. Lakehouse Federation vs. Delta Sharing

A lakehouse Federation permite que o senhor consulte fontes de dados externas sem mover seus dados. Delta Sharing permite que o senhor compartilhe com segurança dados ao vivo entre plataformas, clouds e regiões. Databricks recomenda a ingestão usando o LakeFlow Connect porque ele se adapta a grandes volumes de dados, consultas de baixa latência e limites de API de terceiros. No entanto, o senhor pode querer consultar seus dados sem movê-los.

Quando o senhor puder escolher entre LakeFlow Connect, lakehouse Federation e Delta Sharing, escolha Delta Sharing para os seguintes cenários:

  • Limitar a duplicação de dados.

  • Consultando os dados mais recentes possíveis.

Escolha a Lakehouse Federation para os seguintes cenários:

  • Relatórios ad hoc ou trabalho de prova de conceito em seu pipeline ETL.

LakeFlow Connect vs. Auto Loader

LakeFlow O Connect fornece conectores integrados que permitem a ingestão incremental de dados de aplicativos e bancos de dados corporativos. Auto Loader é um conector para o armazenamento de objetos cloud que permite que o senhor ingira arquivos de forma incremental à medida que eles chegam em S3, ADLS e GCS. Ele é compatível com a transmissão estruturada e com o site Delta Live Tables, mas não se integra ao LakeFlow Connect.

O LakeFlow Connect pode gravar de volta em aplicativos e bancos de dados de terceiros?

Não. Se o senhor estiver interessado nessa funcionalidade, entre em contato com a equipe do account.

Qual é o custo do LakeFlow Connect?

Por enquanto, os clientes são cobrados apenas pelo uso do serverless Delta Live Tables necessário para carregar dados da fonte (se estiver se conectando a um aplicativo corporativo, como o Salesforce) ou do volume de preparação (se estiver se conectando a um banco de dados, como o SQL Server). O modelo final de preços do LakeFlow Connect pode incluir cobranças adicionais e será anunciado no futuro.

serverless Delta Live Tables preços está visível em nossa página de preços.