Pular para o conteúdo principal

Ferramentas de desenvolvimento local

Databricks fornece um ecossistema de ferramentas para ajudá-lo a desenvolver aplicativos e soluções que se integram ao Databricks e gerenciam programaticamente Databricks recursos e dados.

Este artigo apresenta uma visão geral dessas ferramentas e recomendações sobre as melhores ferramentas para cenários comuns de desenvolvedores.

Quais ferramentas a Databricks oferece para o desenvolvimento local?

A tabela a seguir fornece uma lista das ferramentas de desenvolvedor fornecidas pela Databricks.

Ferramenta

Descrição

Autenticação e autorização

Configure a autenticação e a autorização para que suas ferramentas, scripts e aplicativos funcionem com a Databricks.

Databricks Connect

Conecte-se ao Databricks usando ambientes de desenvolvimento integrado (IDEs) populares, como PyCharm, IntelliJ IDEA, Eclipse, RStudio e JupyterLab.

Se você usa o Visual Studio Code, Databricks recomenda a extensãoDatabricks para Visual Studio Code, que é baseada no Databricks Connect, pois fornece recursos adicionais para facilitar a configuração.

Extensão do Databricks para Visual Studio Code

Conecte-se ao espaço de trabalho remoto do Databricks a partir do ambiente de desenvolvimento integrado (IDE) do Visual Studio Code.

Plugin PyCharm Databricks

Configure uma conexão com um site remoto Databricks workspace e execute arquivos em Databricks clustering a partir de PyCharm. Esse plug-in é desenvolvido e fornecido pela JetBrains em parceria com a Databricks.

SDKs da Databricks

Automatize Databricks a partir de uma biblioteca de código escrita para linguagens populares como Python, Java, Go e R. Em vez de enviar chamadas API REST diretamente usando curl ou Postman, utilize um SDK para interagir com Databricks usando a linguagem de programação de sua preferência. Os SDKs Databricks oferecem suporte à API REST completa e fornecem outros recursos, incluindo autenticação unificada e paginação, o que os torna fáceis de usar e estender para abranger diversos cenários.

Drivers e ferramentas SQL

Conecte-se a Databricks para executar SQL comandos e scripts, interagir programaticamente com Databricks e integrar a funcionalidade Databricks SQL a aplicativos escritos em linguagens populares, como Python, Go, JavaScript e TypeScript.

CLI do Databricks

Acesse as funcionalidades do Databricks usando a interface de linha de comando (CLI) do Databricks. A CLI encapsula a API REST do Databricks, portanto, em vez de enviar chamadas à API REST diretamente usando curl ou Postman, use a CLI do Databricks para interagir com o Databricks.

Databricks Asset Bundles

Implemente práticas recomendadas de desenvolvimento, teste e implantação padrão da indústria (CI/CD) para seus dados Databricks e projetos AI usando Databricks ativo Bundles.

Provedor Terraform da Databricks e Terraform CDKTF para Databricks

provisionamento Databricks infraestrutura e recurso usando Terraform.

Ferramentas de CI/CD

Integrar sistemas e estruturas populares de CI/CD, como GitHub Actions, Jenkins e Apache Airflow.

dica

Você também pode conectar muitas outras ferramentas populares de terceiros a clusters e SQL Warehouse para acessar dados no Databricks. Para mais informações, consulte parceiro tecnológico.

Qual ferramenta de desenvolvedor devo usar?

A tabela a seguir descreve as recomendações de ferramentas da Databricks para cenários comuns de desenvolvedores.

Ferramenta

Recomendação de uso

Extensão do Databricks para Visual Studio Code

Plugin PyCharm Databricks

Para outros IDEs, use o Databricks CLI com o Databricks Connect

  • Desenvolvimento interativo e depuração a partir de um IDE local

CLI do Databricks

  • Interação direta com o Databricks a partir da linha de comando
  • Script de shell
  • Experimentação
  • Chamar a API REST diretamente
  • gerenciar perfis de autenticação local
  • Sincronizar o código do IDE com o site Databricks workspace

Databricks ativo Bundles (um recurso do site CLI)

  • gerenciar fluxo de trabalho e projetos implantados para Databricks
  • Aplicar as práticas recomendadas de CI/CD
  • Co-versão, coautor, co-implantado seu recurso e ativo como uma unidade
  • Suporta os recursos mais comuns

Provedor Databricks Terraform

  • Infraestrutura como código, CI/CD
  • Administrar e criar espaços de trabalho, catálogos, metastores e aplicar permissões
  • Garanta a portabilidade do ambiente e a recuperação de desastres
  • Muitos apoiaram o recurso

SDK Python da Databricks

SDK Java da Databricks

Databricks Go SDK

Databricks R SDK

  • Desenvolvimento de aplicativos
  • Integre com os sistemas de implantação existentes
  • Criar um Databricks fluxo de trabalho personalizado e um novo serviço da web

Drivers SQL

  • execução SQL comando e scripts de aplicativos clientes

API REST da Databricks

  • Automatizar processos em que não há um SDK disponível em sua linguagem de programação preferida
  • Somente cenários avançados
  • Quase todos os Databricks recursos estão disponíveis