O que é a Lakehouse Federation?
A lakehouse Federation é a plataforma de federação de consultas para Databricks. O termo federação de consultas descreve um conjunto de recursos que permite que usuários e sistemas executem consultas em várias fontes de dados sem a necessidade de migrar todos os dados para um sistema unificado.
Há dois tipos de federação: federação de consultas e federação de catálogos. Esta página aborda as diferenças entre os tipos.
Federação de consultas em comparação com federação de catálogos
A tabela a seguir resume as diferenças do key entre a federação de consultas e a federação de catálogos:
Atributo | Federação de consultas | Federação de catálogos |
---|---|---|
Caminho da consulta | As consultas do Unity Catalog são enviadas para o banco de dados externo usando JDBC. A consulta está sendo executada tanto em Databricks quanto remotamente em compute. | As consultas do Unity Catalog acessam diretamente a tabela externa no armazenamento de objetos. A federação de catálogos está disponível para plataformas que suportam acesso direto ao seu catálogo e serviço de armazenamento. A consulta é executada apenas em Databricks compute, o que significa que a federação de catálogos é mais econômica e otimizada em termos de desempenho do que a federação de consultas. |
Caso de uso |
Quando sua fonte suporta tanto a federação lakehouse quanto o LakeFlow Connect, Databricks recomenda LakeFlow Connect se o desempenho em volumes de dados mais altos e menor latência forem prioridades. |
|
Visão geral das etapas |
|
|
Fontes de dados compatíveis
Conecte-se às seguintes fontes usando a federação de consultas:
- MySQL
- PostgreSQL
- Teradata
- Oracle
- Amazon Redshift
- Nuvem de dados do Salesforce
- Snowflake
- Microsoft SQL Server
- Azure Synapse (SQL Data Warehouse)
- Google BigQuery
- Databricks
Conecte-se às seguintes fontes usando a federação de catálogos: