tutorial: Criar e implantar um pacote no workspace
Visualização
Databricks O ativo Bundles no site workspace está em visualização pública.
Para ajudá-lo a começar a usar Databricks ativo Bundles no workspace, este tutorial orienta o senhor na criação de um bundle com um Job, implantando-o e executando o Job no bundle - tudo a partir do workspace.
Para saber os requisitos para o uso de pacotes no site workspace, consulte Databricks ativo Bundles in the workspace requirements.
Para obter mais informações sobre pacotes, consulte What are Databricks ativo Bundles?
Crie um pacote
Primeiro, crie um pacote no site Databricks workspace:
-
Navegue até a pasta Git onde deseja criar o pacote.
-
Clique no botão Create e, em seguida, clique em ativo bundle . Como alternativa, clique com o botão direito do mouse na pasta Git ou em seu kebab associado na árvore workspace e clique em Create > ativo bundle :
-
Na caixa de diálogo Create an ativo bundle (Criar um pacote ativo), dê um nome ao pacote ativo, como totally-awesome-bundle (pacote totalmente incrível) . O nome do pacote só pode conter letras, números, traços e sublinhado. Selecione Projeto vazio .
-
Clique em Criar .
Isso cria um pacote inicial na pasta Git, que inclui um arquivo de configuração .gitignore
Git e o arquivo Databricks ativo Bundles databricks.yml
necessário. O arquivo databricks.yml
contém a configuração principal do pacote. Para obter detalhes, consulte Databricks ativo Bundle configuration.
Definir um Job que executa um Notebook
Em seguida, adicione um Job ao seu pacote que executa um Notebook. O Notebook no exemplo a seguir imprime "Hello World!".
-
Clique no bloco de projeto Create Notebook bundle. Como alternativa, clique no kebab do pacote no índice e, em seguida, clique em Create > Notebook .
-
Renomeie o Notebook para helloworld .
-
Defina o idioma do Notebook como Python e cole o seguinte na célula do Notebook:
Pythonprint("Hello World!")
-
Clique no ícone de implantação do pacote para alternar para o painel Implantações.
-
Em Bundle recurso , clique em Create e, em seguida, em Create new Job definition .
-
Digite execução-Notebook no campo Job name da caixa de diálogo Create Job definition . Clique em Criar . É criado um arquivo de definição de trabalho
run-notebook.job.yml
, com YAML básico para o trabalho e alguns exemplos adicionais comentados de YAML para um trabalho. -
Agora, adicione uma tarefa do Notebook à definição do trabalho. Copie e cole o seguinte YAML no arquivo
run-notebook.job.yml
, substituindo o YAML básico:YAMLresources:
jobs:
run_notebook:
name: run-notebook
queue:
enabled: true
tasks:
- task_key: my-notebook-task
notebook_task:
notebook_path: ../helloworld.ipynb
Para obter detalhes sobre a definição de um trabalho em YAML, consulte Trabalho. Para obter a sintaxe YAML de outros tipos de tarefa de trabalho compatíveis, consulte Adicionar tarefa ao trabalho em Databricks ativo Bundles.
implantado o feixe
Em seguida, implante o pacote e execute o trabalho que contém a tarefa helloworld
Notebook.
-
No painel Deployments (Implantações ) do pacote para Targets (Alvos ), clique em dropdown para selecionar o alvo
dev
workspace se ele ainda não estiver selecionado. O espaço de trabalho de destino é definido no mapeamentotargets
do pacotedatabricks.yml
. Consulte Databricks ativo Bundle deployment modes. -
Clique no botão implantado . O pacote é validado e os detalhes da validação aparecem em uma caixa de diálogo.
-
Revise os detalhes da implementação nessa caixa de diálogo de confirmação implantado para desenvolvimento e clique em implantado .
A implantação de pacotes e a execução do recurso de pacote executam o código como o usuário atual. Certifique-se de que o senhor confia no código do pacote, incluindo o YAML, que pode conter definições de configuração que executam o comando.
O status da implantação é exibido na janela de saída do Projeto .
execução do trabalho
Os recursos de feixe implantados estão listados em Recurso de feixe . Clique no ícone de reprodução associado ao recurso de trabalho para executá-lo.
Navegue até o fluxo de trabalho > Job execução para ver a execução do pacote. O nome do bundle Job Execution é prefixado, por exemplo, [dev someone] run-notebook
.