Pular para o conteúdo principal

Desenvolver o código do pipeline DLT em seu ambiente de desenvolvimento local

O senhor pode criar o código-fonte do pipeline Python no ambiente de desenvolvimento integrado (IDE) de sua preferência.

O senhor não pode validar ou executar atualizações no código DLT escrito em um IDE. O senhor deve implantar os arquivos de código-fonte de volta em um Databricks workspace e configurá-los como parte de um DLT pipeline.

Este artigo apresenta uma visão geral do apoio ao desenvolvimento de IDEs locais. Para desenvolvimento e testes mais interativos, o site Databricks recomenda o uso do Notebook. Consulte Desenvolver e depurar o pipeline DLT no Notebook.

Configurar um IDE local para o desenvolvimento do pipeline

A Databricks fornece um módulo Python para desenvolvimento local distribuído pelo PyPI. Para obter instruções de instalação e uso, consulte o stub do Python para DLT.

Este módulo tem as interfaces e referências de docstring para a interface DLT Python, fornecendo verificação de sintaxe, autocompletar e verificação de tipo de dados à medida que o senhor escreve o código no seu IDE.

Esse módulo inclui interfaces, mas não implementações funcionais. O senhor não pode usar essa biblioteca para criar ou executar um DLT pipeline localmente.

O senhor pode usar o Databricks ativo Bundles para empacotar e implantar o código-fonte e as configurações em um workspace de destino e para acionar a execução de uma atualização em um pipeline configurado dessa forma. Consulte Converter um DLT pipeline em um projeto Databricks ativo Bundle.

A extensão Databricks para Visual Studio Code tem funcionalidade adicional para trabalhar com pipeline usando Databricks ativo Bundles. Consulte Bundle recurso Explorer.

Sincronize o código pipeline de seu IDE com um workspace

A tabela a seguir resume as opções de sincronização do código-fonte pipeline entre o IDE local e um Databricks workspace:

Ferramenta ou padrão

Detalhes

Databricks Asset Bundles

Use o Databricks ativo Bundles para implantar o pipeline ativo, cuja complexidade varia de um único arquivo de código-fonte a configurações para vários pipelines, trabalhos e arquivos de código-fonte. Consulte Converter um DLT pipeline em um projeto Databricks ativo Bundle.

Extensão do Databricks para Visual Studio Code

Databricks oferece uma integração com o Visual Studio Code que inclui a sincronização fácil entre o IDE local e os arquivos workspace. Essa extensão também fornece ferramentas para usar Databricks ativo Bundles para implantar o pipeline ativo. Consulte O que é a extensão Databricks para o Visual Studio Code?

arquivos do espaço de trabalho

O senhor pode usar os arquivos Databricks workspace para upload seu código-fonte pipeline para seu Databricks workspace e, em seguida, importar esse código para um pipeline. Consulte O que são arquivos workspace?

Pastas Git

Git permitem que o senhor sincronize o código entre seu ambiente local e Databricks workspace usando um repositório Git como intermediário. Consulte Integração do Git para pastas Git do Databricks.