Conceitos de conectores do Microsoft SQL Server
Esta página descreve como funciona o conector do SQL Server, incluindo seus conceitos principais.
Como o Databricks se conecta ao SQL Server?
O Databricks se conecta ao SQL Server usando Transport Layer Security (TLS) e uma conexão JDBC. As credenciais são armazenadas com segurança no Unity Catalog e só podem ser recuperadas se o usuário que executa o fluxo de ingestão tiver as permissões apropriadas. A Databricks recomenda a criação de um usuário separado do SQL Server para a ingestão de dados. Se houver bancos de dados ou tabelas que você não deseja expor a este usuário, você pode usar as permissões integradas SQL Server .
Como o conector extrai dados incrementalmente?
O conector usa o acompanhamento de alterações Microsoft e a captura de dados de alterações (CDC) Microsoft (CDC). Se uma tabela possui uma key primária, Databricks recomenda o uso do acompanhamento de alterações para um desempenho ideal. Se uma tabela não tiver uma key primária, Databricks recomenda o uso CDC. Se o acompanhamento de alterações e CDC estiverem ambos ativados, o conector usa o acompanhamento de alterações.
Variações do banco de dados
O conector é compatível com bancos de SQL SQL Azure e AWS RDS. Isso inclui o SQL Server executado em máquinas virtuais (VMs) do Azure e no Amazon EC2. O conector também oferece suporte SQL Server on-premises usando Azure ExpressRoute, AWS Direct Connect e VPN, caso haja largura de banda suficiente disponível.
Métodos de autenticação
- O conector suporta os seguintes métodos de autenticação:
- Autenticação OAuth de usuário para máquina (U2M) com ID Microsoft Entra
- Nome de usuário e senha
Ingestão versus federação de consultas no SQL Server
Além do conector de ingestão SQL Server no LakeFlow Connect, Databricks oferece um conector sem cópia no Lakehouse Federation. O conector de cópia zero permite consultar dados no SQL Server sem movê-los.