Pular para o conteúdo principal

Conceitos de conectores do Microsoft SQL Server

Esta página descreve como funciona o conector do SQL Server, incluindo seus conceitos principais.

Como o Databricks se conecta ao SQL Server?

O Databricks se conecta ao SQL Server usando Transport Layer Security (TLS) e uma conexão JDBC. As credenciais são armazenadas com segurança no Unity Catalog e só podem ser recuperadas se o usuário que executa o fluxo de ingestão tiver as permissões apropriadas. A Databricks recomenda a criação de um usuário separado do SQL Server para a ingestão de dados. Se houver bancos de dados ou tabelas que você não deseja expor a este usuário, você pode usar as permissões integradas SQL Server .

Como o conector extrai dados incrementalmente?

O conector usa o acompanhamento de alterações Microsoft e a captura de dados de alterações (CDC) Microsoft (CDC). Se uma tabela possui uma key primária, Databricks recomenda o uso do acompanhamento de alterações para um desempenho ideal. Se uma tabela não tiver uma key primária, Databricks recomenda o uso CDC. Se o acompanhamento de alterações e CDC estiverem ambos ativados, o conector usa o acompanhamento de alterações.

Variações do banco de dados

O conector é compatível com bancos de SQL SQL Azure e AWS RDS. Isso inclui o SQL Server executado em máquinas virtuais (VMs) do Azure e no Amazon EC2. O conector também oferece suporte SQL Server on-premises usando Azure ExpressRoute, AWS Direct Connect e VPN, caso haja largura de banda suficiente disponível.

Métodos de autenticação

  • O conector suporta os seguintes métodos de autenticação:
    • Autenticação OAuth de usuário para máquina (U2M) com ID Microsoft Entra
    • Nome de usuário e senha

Ingestão versus federação de consultas no SQL Server

Além do conector de ingestão SQL Server no LakeFlow Connect, Databricks oferece um conector sem cópia no Lakehouse Federation. O conector de cópia zero permite consultar dados no SQL Server sem movê-los.