Driver JDBC do Databricks
O código-fonte do driver JDBC do Databricks está disponível publicamente sob a licença Apache 2.0.
Isso reflete o compromisso da Databricks com a transparência, a colaboração e o poder do desenvolvimento orientado pela comunidade. Contribuições de desenvolvedores, usuários e da comunidade são bem-vindas. Para começar, consulte as Diretrizes de contribuição.
O driver JDBC Databricks permite que você conecte ferramentas como DataGrip, DBeaver e SQL Workbench/J ao Databricks por meio Java Database Connectivity (JDBC), uma especificação padrão do setor para acessar sistemas de gerenciamento de banco de dados.
Esse driver implementou o JDBC APIs e fornece a funcionalidade principal, incluindo OAuth, Cloud Fetch e recurso como Unity Catalog ingestão de volume. Ele executa o modo de consulta nativa e oferece suporte a consultas parametrizadas nativas, e pode ser executado usando o Statement Execution APIs, que fornece o recurso de retenção de resultados de consultas benéficas, ou Thrift.
Nos sistemas operacionais IBM AIX, o formato de resultado do Apache Arrow não é compatível. Como o Cloud Fetch depende do Arrow, o Cloud Fetch também não é compatível com o AIX. Para evitar erros durante a execução do SQL, desative o Arrow definindo a propriedade de conexão JDBC: EnableArrow=0
Este artigo fornece informações sobre a instalação e uso do driver Databricks JDBC , versão 3 e acima. Para informações sobre o Databricks JDBC Driver (Simba), abaixo da versão 3, consulte Databricks JDBC Driver (Simba).
Requisitos
Para usar o driver JDBC do Databricks, os seguintes requisitos devem ser atendidos:
- Java Runtime Environment (JRE) 11.0 ou superior. O teste de CI é suportado no JRE 11, 17 e 21.
Uma ramificação dedicada do JDK 8 está disponível para usuários que precisam de compatibilidade com o Java 8. Os usuários podem criar um JAR a partir dessa ramificação, conforme necessário. Esse ramo é sincronizado com o ramo principal periodicamente, mas as contribuições da comunidade são bem-vindas para mantê-lo atualizado. Consulte a ramificação do JDK 8 do driver JDBC da Databricks.
Como resultado de uma alteração no JDK 16 que causou um problema de compatibilidade com a biblioteca Apache Arrow usada pelo driver JDBC, podem ocorrer erros de tempo de execução ao usar o driver JDBC com o JDK 16 ou o acima. Para evitar esses erros, reinicie o aplicativo ou o driver usando a seguinte opção de comando JVM:
--add-opens=java.base/java.nio=org.apache.arrow.memory.core ALL-UNNAMED
Instale o driver
O driver JDBC Databricks está publicado no repositórioMaven.
Para instalar o driver, você pode fazer o seguinte:
-
Para projetos Maven, adicione a seguinte dependência ao arquivo
pom.xml
do projeto para instruir o Maven a download automaticamente o driver JDBC com a versão especificada:XML<dependency>
<groupId>com.databricks</groupId>
<artifactId>databricks-jdbc</artifactId>
<version>3.0.1</version>
<scope>runtime</scope>
</dependency> -
Para os projetos do Gradle, adicione a seguinte dependência ao arquivo de compilação do projeto para instruir o Gradle a download automaticamente o driver JDBC com a versão especificada:
Groovyimplementation 'com.databricks:databricks-jdbc:3.0.1'
Para view a sintaxe de dependência para outros tipos de projeto e obter o número da versão mais recente do driver JDBC Databricks , consulte o repositórioMaven.
Próximas etapas
- Configurar um URL de conexão
- Propriedades de autenticação e configuração de proxy
- Propriedades de configuração do SQL
- Configuração do armazenamento de confiança SSL
- Ativar registro
- Gerenciar arquivos em volumes
- Exemplo: execução de uma consulta usando o driver JDBC