Conecte-se ao AI Runtime

info

Visualização

Este recurso está em Pré-visualização Pública.

Conecte-se ao AI Runtime a partir de notebooks interativos, um IDE por meio de um túnel SSH, jobs agendados, da API de Jobs ou de Pacotes de Automação Declarativa. Anexar um Notebook ao AI Runtime é a maneira principal de executar cargas de trabalho de treinamento e ajuste fino, e você pode programar os mesmos Notebooks como jobs recorrentes ou automatizá-los em pipelines de implantação.

Interativo (Notebook)

Esta é a principal forma de usar o AI Runtime. Para conectar seu notebook e configurar o ambiente:

Em um notebook, clique no menu suspenso compute " na parte superior e selecione "GPU sem servidor" .
Clique no Para abrir o painel lateral Ambiente .
Selecione um acelerador no campo Acelerador . Para cargas de trabalho de treinamento distribuídas, selecione 8xH100 . Consulte a seção Opções de hardware para obter orientações sobre como escolher um acelerador.
Selecione **Standard v5** ou **Standard v4** para o ambiente Standard, ou **AI v5** ou **AI v4** para o ambiente de AI, no campo **Ambiente base**.
Clique em Aplicar e, em seguida, confirme que deseja aplicar o AI Runtime ao seu ambiente de notebook.

nota

A conexão com seu compute será encerrada automaticamente após 60 minutos de inatividade.

dica

Para operações que não exigem GPUs (por exemplo, clonar um repositório Git , converter formatos de dados ou realizar análise exploratória de dados), conecte seu Notebook a um cluster de CPUs para preservar os recursos de GPU.

Conectando a partir do terminal da IDE

Você pode se conectar ao AI Runtime no compute de GPU serverless diretamente de um terminal em seu IDE por meio de um túnel SSH.

Para conectar-se ao AI Runtime, execute o comando databricks ssh connect com a opção --accelerator a partir de um terminal no seu IDE. Nenhum o passo de configuração separado é necessário. Para obter mais informações sobre o comando, consulte ssh grupo de comando.

Bash
databricks ssh connect --accelerator=GPU_1xA10

Para conectar e começar a sessão no Visual Studio Code ou Cursor, use a opção --ide. A CLI abre uma janela do IDE apontando para a pasta inicial do workspace.

Bash
databricks ssh connect --ide=vscode

Para mais detalhes sobre a configuração, a abertura de projetos e a execução de código, consulte Conectar-se ao Databricks usando um túnel SSH.

Tarefas (Agendadas)

Você pode programar Notebooks que usam o AI Runtime como Jobs recorrentes. Consulte Crie e gerencie Jobs de Notebooks programados para mais detalhes.

Após abrir o Bloco de Anotações que deseja usar:

Selecione o botão "Programar" no canto superior direito.
Selecione Adicionar programar .
Preencha o formulário Novo programar com o nomeJob , programar e compute .
Selecione Criar .

Você também pode criar e programar trabalhos a partir da interface de trabalho de trabalhos e pipelines . Consulte Criar um novo trabalho para obter orientações passo a passo.

nota

Adicionar dependências usando o painel Ambientes não é compatível com jobs agendados do AI Runtime. As dependências devem ser instaladas programaticamente no seu Notebook (por exemplo, %pip install). A recuperação automática não é compatível. Se o seu Job falhar devido a pacotes incompatíveis, é preciso corrigir e fazer a execução novamente manualmente.

Para cargas de trabalho que possam exceder o tempo de execução máximo de 7 dias, implemente o ponto de verificação manual para permitir a retomada. Recomendamos o uso de volumes do Unity Catalog por meio de UCVolumeWriter e UCVolumeReader de serverless_gpu.data. Ver Ponto de verificação de modelo.

API de Jobs e Pacotes de Automação Declarativa

Você pode criar e gerenciar programaticamente jobs do AI Runtime usando a API de Jobs do Databricks ou os Pacotes de Automação Declarativa. Configure o tipo de compute como GPU serverless na definição do seu job ou pacote para automatizar pipelines de implantação.

O exemplo a seguir mostra uma configuração de Pacotes de Automação Declarativa para um job do AI Runtime usando o ambiente padrão:

YAML
resources:
  jobs:
    sample_job:
      name: sample_job_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: default
          spec:
            environment_version: '4'

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: default
          compute:
            hardware_accelerator: GPU_8xH100

Para usar o ambiente de AI do Databricks em vez do ambiente Standard, defina base_environment como o identificador de ambiente de AI (por exemplo, databricks_ai_v5 para AI v5) no ambiente spec e faça referência a ele a partir do environment_key da tarefa:

info

Beta

Selecionar um ambiente de AI do Databricks como um ambiente base de workspace está em Beta e requer que um administrador do workspace se inscreva. Consulte Construa para compute de GPU serverless (AI Runtime).

YAML
resources:
  jobs:
    sample_job:
      name: sample_job_aiv5_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: aiv5
          spec:
            base_environment: databricks_ai_v5

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: aiv5
          compute:
            hardware_accelerator: GPU_8xH100

Interativo (Notebook)​

Conectando a partir do terminal da IDE​

Tarefas (Agendadas)​

API de Jobs e Pacotes de Automação Declarativa​

Interativo (Notebook)

Conectando a partir do terminal da IDE

Tarefas (Agendadas)

API de Jobs e Pacotes de Automação Declarativa