ConexõesUnity Catalog
Uma conexão é um objeto protegível no Unity Catalog que armazena o endpoint e as credenciais necessárias para acessar um sistema externo. Ele reside diretamente abaixo do metastore na hierarquia de objetos Unity Catalog . Um conjunto de conexões reúne:
- O endpoint ou URL do sistema externo
- Credenciais de autenticação
- Parâmetros de configuração
- Proprietário e metadados
As conexões são distintas das credenciais de armazenamento (para armazenamento de objetos cloud ) e das credenciais de serviço (para serviços cloud que não sejam de armazenamento).
Tipos de conexão
conexões de ingestão de grandes
Ingestão totalmente gerenciada e serverless de aplicativos SaaS e bancos de dados em tabelas Delta . Duas categorias: conectores SaaS (API direta) e conectores de banco de dados (CDC). Alguns tipos de banco de dados se sobrepõem à federação. A mesma conexão pode servir para ambos os fins, dependendo de como for utilizada.
Consulte Conectar para gerenciar fontes de ingestão e gerenciar conectores no LakeFlow Connect.
Consultar conexões de federação
Consultas somente leitura em bancos de dados externos sem mover catálogos externos que espelham a estrutura do banco de dados externo. As consultas são enviadas para o banco de dados externo usando JDBC.
Consulte O que é federação de consultas? e Gerenciar conexões para a Federação Lakehouse.
Conexões de federação de catálogos
Conecte catálogos externos (um Hive metastore, AWS Glue ou catálogo Snowflake Horizon) ao Databricks. O Unity Catalog rastreia os metadados do catálogo externo e preenche automaticamente um catálogo externo, consultando os dados diretamente no armazenamento de arquivos de origem.
Veja O que é federação de catálogos?
Conexões JDBC
Acesso de leitura e gravação a bancos de dados externos usando drivers JDBC por meio da API Spark Fonte de Dados ou API Remote Query SQL .
Consulte Conexão JDBC.
Conexões HTTP
Comunicação com serviço HTTP externo através de um proxy Databricks-gerenciar. Fornece suporte APIs REST externas, integrações MCP e ferramentas de agentes AI .
Consulte Conectar a um serviço HTTP externo e Instalar um servidor MCP externo.
Como escolher um tipo de conexão
Tipo | Caso de uso | Ler | Gravar | Nível de governança |
|---|---|---|---|---|
grande ingestão | Ingerir dados de aplicativos SaaS ou bancos de dados em tabelas Delta. | Ingestão para Delta | N/A | Nível de conexão |
Federação de queries | Consultar um banco de dados externo diretamente, sem copiar dados. | Sim | Não | Nível da mesa |
Federação de catálogos | Conecte catálogos externos para consultar dados diretamente no armazenamento de arquivos de origem. | Sim | Não | Nível da mesa |
JDBC | Ler e gravar em um banco de dados externo com um driver JDBC específico. | Sim | Sim | Nível de conexão |
HTTP | Conecte-se a APIs HTTP externas, servidores MCP ou ferramentas de agente. | N/A | N/A | Nível de conexão |
Criar uma conexão
Você pode criar conexões usando:
- SQL :
CREATE CONNECTION connection_name TYPE connection_type OPTIONS (...) - Interface do Explorador de Catálogo : Catálogo > Criar > Criar uma conexão
- API REST ou CLI do Databricks
A instrução SQL CREATE CONNECTION suporta os seguintes valores TYPE: DATABRICKS, HTTP, MYSQL, POSTGRESQL, REDSHIFT, SNOWFLAKE, SQLDW, SQLSERVER. Os tipos de ingestão de SaaS (como Salesforce, HubSpot e Jira) só podem ser criados usando a interface do usuário ou APIs.
Consulte CREATE CONNECTION na referência SQL.
Segurança: conexões versus controle de saída
A segurança para conectividade de saída opera em múltiplas camadas:
As conexões do Unity Catalog gerenciam as credenciais e a configuração da conexão (URL, host, porta, opções). Eles fornecem uma maneira segura e controlada de armazenar e compartilhar detalhes de autenticação e configurações de conexão para sistemas externos sem incorporar segredos no código.
As políticas de rede regem o acesso à rede. Eles controlam tanto a conectividade de saída do Databricks compute endpoints externos quanto a conectividade de entrada de fontes externas para seu workspace. As conexões do Unity Catalog não impõem restrições de rede. Para gerenciar o tráfego permitido em ambas as direções, configure as regras de rede.