Colaborar em pacotes no workspace
Os pacotes de automação declarativa (anteriormente conhecidos como Databricks Ativo Bundles) são criados, implantados em um workspace e, em seguida, gerenciados programaticamente a partir do seu ambiente de desenvolvimento local ou diretamente na interface do usuário workspace . A colaboração em pacotes diretamente no workspace permite iterações e testes mais rápidos antes da implementação em produção.
Para obter mais informações sobre pacotes, consulte O que são pacotes de automação declarativa?.
Se não quiser usar a interface do usuário workspace para criar e gerenciar seus pacotes, mas ainda assim quiser desenvolvê-los no workspace, poderá usar o Databricks CLI no terminal da Web workspace, da mesma forma que faria no terminal local. Veja execução Databricks CLI comando.
Quais são os requisitos de instalação de pacotes no site workspace?
O senhor não precisa instalar nada localmente para usar os pacotes no workspace, mas há requisitos do Databricks workspace :
- Os arquivos do espaço de trabalho devem estar ativados. Consulte O que são arquivos workspace?
- Você precisa ter uma pasta Git na qual criar o pacote. Para criar uma pasta Git , consulte Clonar um repo.
- sem servidor compute deve estar ativado. Consulte os requisitos do compute sem servidor.
- Os pacotes no workspace são compatíveis com o controle de saídaserverless. No entanto, se você precisar compilar projetos Python usando o pacote do registro público PyPi, use um espelho privado.
A versão do site Databricks CLI usada para implantar um pacote e executar recurso no site workspace é fornecida na caixa de diálogo implantado .
Preciso entender como criar o YAML para usar os pacotes no site workspace?
Não. Os Pacotes de Automação Declarativa no workspace fornecem uma interface de usuário para gerenciar pacotes, permitindo a colaboração em pacotes desenvolvidos por outros usuários em seus ambientes de desenvolvimento locais. Você não precisa aprender YAML nem saber como usar a CLI Databricks para trabalhar com pacotes no workspace.
Eu já gerencio meu fluxo de trabalho na UI do Databricks. Por que eu deveria usar pacotes?
O Declarative Automation Bundles permite que você controle a origem de todos os arquivos necessários para o seu fluxo de trabalho. Os pacotes no workspace fornecem um mecanismo para que os usuários workspace editem, commit, testem e implantem atualizações por meio da interface do usuário. Os usuários iniciam um projeto de pacote a partir de uma pasta Git.
Tenho um pacote em um repositório do GitHub. Como posso editá-lo no site Databricks workspace?
Uma pasta é identificada como um pacote pela Databricks se existir um arquivo databricks.yml na raiz da pasta. Crie uma pasta Git no Databricks para seu repositório do GitHub, e o Databricks o reconhecerá como um pacote.
Há suporte para todas as configurações de pacotes no site workspace?
Quase todos os seus pacotes existentes podem ser gerenciados no workspace. No entanto, Python para Pacotes de Automação Declarativa não é suportado atualmente no workspace.
Como faço para compartilhar um pacote para colaboração?
Os pacotes herdam as permissões de sua pasta Git principal, portanto, para compartilhar um pacote, compartilhe a pasta Git que contém o projeto do pacote com seus colaboradores. Consulte Colaborar, revisar e implantar na produção.
Como posso mover um pacote para produção no site workspace?
Os pacotes definem um projeto completo a ser implantado, a infraestrutura necessária para execução do projeto e os alvos de implantação. Esses objetivos são normalmente seus modos de desenvolvimento e produção. Os pacotes de automação declarativa no workspace facilitam a troca de alvos, implantação e fluxo de trabalho de execução a partir da IU. Veja bundles implantados e fluxo de trabalho de execução a partir do workspace.
Posso implantar meu pacote em outro workspace Databricks a partir do editor de pacotes?
Não, isso não é suportado. Databricks recomenda desenvolver no editor de pacotes no workspace, confirmar as alterações sincronizando a pasta Git e, em seguida, configurar um fluxo de trabalho CI/CD (por exemplo, um GitHub Actions) que use a CLI para implantar o pacote em outro workspace.