Pular para o conteúdo principal

tutorial: Criar e implantar um pacote no workspace

Para ajudar você a começar a usar os Pacotes de Automação Declarativa no workspace, este tutorial orienta você na criação de um pacote com um Job, na implantação dele e na execução do Job no pacote - tudo a partir do workspace.

Para obter informações sobre os requisitos de uso de pacotes no workspace, consulte os requisitos de pacotes de automação declarativa no workspace.

Para obter mais informações sobre pacotes, consulte O que são pacotes de automação declarativa?.

Crie um pacote

Primeiro, crie um pacote no site Databricks workspace:

  1. Navegue até a pasta Git onde deseja criar o pacote.
dica

Se o senhor tiver aberto anteriormente a pasta Git no editor em workspace, poderá usar o menu de contextos de criação do navegador workspace para navegar rapidamente até a pasta Git. Consulte Contextos de criação.

  1. Clique no botão Create e, em seguida, clique em ativo bundle . Como alternativa, clique com o botão direito do mouse na pasta Git ou em seu kebab associado na árvore workspace e clique em Create > ativo bundle :

    Criar um pacote ativo

  2. Na caixa de diálogo Create an ativo bundle (Criar um pacote ativo ), dê um nome ao pacote ativo, como totally-awesome-bundle (pacote totalmente incrível) . O nome do pacote só pode conter letras, números, traços e sublinhado. Selecione Empty project (Projeto vazio ) e clique em Create and implantado .

    Criar nova caixa de diálogo do pacote ativo

Isso cria um pacote inicial na pasta Git, que inclui um arquivo de configuração Git .gitignore e o arquivo Declarative Automation Bundles databricks.yml necessário. O arquivo databricks.yml contém a configuração principal do pacote. Para obter detalhes, consulte a configuração de pacotes de automação declarativa.

Novo pacote ativo

Adicionar um caderno

Em seguida, adicione um Notebook ao seu pacote. O Notebook no exemplo a seguir imprime “Olá, mundo!”.

  1. Clique no bloco Adicionar projeto do pacote Notebook . Como alternativa, clique no kebab do pacote no índice e depois clique em Criar > Notebook .

  2. Renomeie o Notebook para helloworld .

  3. Defina o idioma do Notebook como Python e cole o seguinte na célula do Notebook:

    Python
    print("Hello World!")

Definir um trabalho

Agora defina um Job que execute o Notebook.

  1. Clique no ícone de implantação do pacote para alternar para o painel Implantações.

    Ícone do painel de implantações

  2. Na seção Bundle recurso , clique em Adicionar e depois em Nova definição de trabalho .

    Criar definição de trabalho

  3. Digite execução-Notebook no campo NomeJob da caixa de diálogo Adicionar trabalho ao pacote existente . Clique em Adicionar e instalado .

  4. Uma caixa de diálogo de confirmação de desenvolvimento aparece com informações sobre o recurso do Job que será criado no workspace de destino do desenvolvimento. Clique em implantado .

  5. Navegue de volta para os arquivos do pacote clicando no ícone de pasta acima do ícone de implantações. Um recurso de trabalho run-notebook.job.yml foi criado com YAML básico para o trabalho e alguns exemplos adicionais comentados de tarefa YAML.

  6. Adicione uma tarefa do Notebook à definição do trabalho. Substitua o YAML de exemplo no arquivo run-notebook.job.yml pelo seguinte:

    YAML
    resources:
    jobs:
    run_notebook:
    name: run-notebook
    queue:
    enabled: true
    tasks:
    - task_key: my-notebook-task
    notebook_task:
    notebook_path: ../helloworld.ipynb

    Job Configuração da tarefa do notebook YAML

Para obter detalhes sobre como definir um Job em YAML, consulte Job. Para obter a sintaxe YAML para outros tipos de tarefas de Job compatíveis, consulte Adicionar tarefa ao Job em Pacotes de Automação Declarativa.

implantado o feixe

Em seguida, implante o pacote e execute o trabalho que contém a tarefa helloworld Notebook.

  1. No painel Implantações do pacote em Destinos , clique no dropdown para selecionar o workspace de destino dev se ainda não estiver selecionado. O espaço de trabalho de destino é definido no mapeamento targets do pacote databricks.yml. Consulte os modos de implantação dos Declarative Automation Bundles.

    Escolha a implantação de destino

  2. Clique no botão implantado . O pacote é validado e os detalhes da validação aparecem em uma caixa de diálogo.

  3. Revise os detalhes da implementação nessa caixa de diálogo de confirmação implantado para desenvolvimento e clique em implantado .

    implantado no diálogo de desenvolvimento

importante

A implantação de pacotes e a execução do recurso de pacote executam o código como o usuário atual. Certifique-se de que o senhor confia no código do pacote, incluindo o YAML, que pode conter definições de configuração que executam o comando.

O status da implantação é exibido na janela de saída do Projeto .

execução do trabalho

Os recursos de feixe implantados estão listados em Recurso de feixe . Clique no ícone de reprodução associado ao recurso de trabalho para executá-lo.

Listar recurso implantado

Navegue até Job execução na barra de navegação à esquerda para ver a execução do pacote. O nome do bundle Job Execution é prefixado, por exemplo, [dev someone] run-notebook.

Próximas etapas