Pular para o conteúdo principal

tutorial: Criar e implantar um pacote no workspace

info

Visualização

Databricks O ativo Bundles no site workspace está em visualização pública.

Para ajudá-lo a começar a usar Databricks ativo Bundles no workspace, este tutorial orienta o senhor na criação de um bundle com um Job, implantando-o e executando o Job no bundle - tudo a partir do workspace.

Para saber os requisitos para o uso de pacotes no site workspace, consulte Databricks ativo Bundles in the workspace requirements.

Para obter mais informações sobre pacotes, consulte What are Databricks ativo Bundles?

Crie um pacote

Primeiro, crie um pacote no site Databricks workspace:

  1. Navegue até a pasta Git onde deseja criar o pacote.

  2. Clique no botão Create e, em seguida, clique em ativo bundle . Como alternativa, clique com o botão direito do mouse na pasta Git ou em seu kebab associado na árvore workspace e clique em Create > ativo bundle :

    Criar um pacote ativo

  3. Na caixa de diálogo Create an ativo bundle (Criar um pacote ativo), dê um nome ao pacote ativo, como totally-awesome-bundle (pacote totalmente incrível) . O nome do pacote só pode conter letras, números, traços e sublinhado. Selecione Projeto vazio .

    Criar nova caixa de diálogo do pacote ativo

  4. Clique em Criar .

    Novo pacote ativo

Isso cria um pacote inicial na pasta Git, que inclui um arquivo de configuração .gitignore Git e o arquivo Databricks ativo Bundles databricks.yml necessário. O arquivo databricks.yml contém a configuração principal do pacote. Para obter detalhes, consulte Databricks ativo Bundle configuration.

Definir um Job que executa um Notebook

Em seguida, adicione um Job ao seu pacote que executa um Notebook. O Notebook no exemplo a seguir imprime "Hello World!".

  1. Clique no bloco de projeto Create Notebook bundle. Como alternativa, clique no kebab do pacote no índice e, em seguida, clique em Create > Notebook .

  2. Renomeie o Notebook para helloworld .

  3. Defina o idioma do Notebook como Python e cole o seguinte na célula do Notebook:

    Python
    print("Hello World!")
  4. Clique no ícone de implantação do pacote para alternar para o painel Implantações.

    Ícone do painel de implantações

  5. Em Bundle recurso , clique em Create e, em seguida, em Create new Job definition .

    Criar definição de trabalho

  6. Digite execução-Notebook no campo Job name da caixa de diálogo Create Job definition . Clique em Criar . É criado um arquivo de definição de trabalho run-notebook.job.yml, com YAML básico para o trabalho e alguns exemplos adicionais comentados de YAML para um trabalho.

  7. Agora, adicione uma tarefa do Notebook à definição do trabalho. Copie e cole o seguinte YAML no arquivo run-notebook.job.yml, substituindo o YAML básico:

    YAML
    resources:
    jobs:
    run_notebook:
    name: run-notebook
    queue:
    enabled: true
    tasks:
    - task_key: my-notebook-task
    notebook_task:
    notebook_path: ../helloworld.ipynb

    Job Configuração da tarefa do notebook YAML

Para obter detalhes sobre a definição de um trabalho em YAML, consulte Trabalho. Para obter a sintaxe YAML de outros tipos de tarefa de trabalho compatíveis, consulte Adicionar tarefa ao trabalho em Databricks ativo Bundles.

implantado o feixe

Em seguida, implante o pacote e execute o trabalho que contém a tarefa helloworld Notebook.

  1. No painel Deployments (Implantações ) do pacote para Targets (Alvos ), clique em dropdown para selecionar o alvo dev workspace se ele ainda não estiver selecionado. O espaço de trabalho de destino é definido no mapeamento targets do pacote databricks.yml. Consulte Databricks ativo Bundle deployment modes.

    Escolha a implantação de destino

  2. Clique no botão implantado . O pacote é validado e os detalhes da validação aparecem em uma caixa de diálogo.

  3. Revise os detalhes da implementação nessa caixa de diálogo de confirmação implantado para desenvolvimento e clique em implantado .

    implantado no diálogo de desenvolvimento

important

A implantação de pacotes e a execução do recurso de pacote executam o código como o usuário atual. Certifique-se de que o senhor confia no código do pacote, incluindo o YAML, que pode conter definições de configuração que executam o comando.

O status da implantação é exibido na janela de saída do Projeto .

execução do trabalho

Os recursos de feixe implantados estão listados em Recurso de feixe . Clique no ícone de reprodução associado ao recurso de trabalho para executá-lo.

Listar recurso implantado

Navegue até o fluxo de trabalho > Job execução para ver a execução do pacote. O nome do bundle Job Execution é prefixado, por exemplo, [dev someone] run-notebook.

Próximas etapas