Conecte-se ao AI Runtime
Pré-visualização pública
Runtime AI para tarefas de nó único está em versão prévia pública. A API de treinamento distribuído para cargas de trabalho com múltiplas GPUs permanece em versão Beta.
Este artigo descreve como conectar-se ao AI Runtime a partir de um Notebook interativo, um Job agendado e a API de Jobs.
Interativo (Notebook)
Esta é a principal forma de usar o AI Runtime. Para conectar seu notebook e configurar o ambiente:
- Em um notebook, clique no menu suspenso compute " na parte superior e selecione "GPU sem servidor" .
- Clique no
Para abrir o painel lateral Ambiente .
- Selecione um acelerador no campo Acelerador . Para cargas de trabalho de treinamento distribuídas, selecione 8xH100 . Consulte a seção Opções de hardware para obter orientações sobre como escolher um acelerador.
- Selecione **Standard v5** ou **Standard v4** para o ambiente Standard, ou **AI v5** ou **AI v4** para o ambiente de AI, no campo **Ambiente base**.
- Clique em Aplicar e, em seguida, confirme que deseja aplicar o AI Runtime ao seu ambiente de notebook.
A conexão com seu compute será encerrada automaticamente após 60 minutos de inatividade.
Para operações que não exigem GPUs (por exemplo, clonar um repositório Git , converter formatos de dados ou realizar análise exploratória de dados), conecte seu Notebook a um cluster de CPUs para preservar os recursos de GPU.
Tarefas (Agendadas)
Você pode programar um Notebook que utilize uma GPU serverless como tarefa recorrente. Consulte Criar e gerenciar tarefas agendadas do Notebook para obter mais detalhes.
Após abrir o Bloco de Anotações que deseja usar:
- Selecione o botão "Programar" no canto superior direito.
- Selecione Adicionar programar .
- Preencha o formulário Novo programar com o nomeJob , programar e compute .
- Selecione Criar .
Você também pode criar e programar trabalhos a partir da interface de trabalho de trabalhos e pipelines . Consulte Criar um novo trabalho para obter orientações passo a passo.
A adição de dependências por meio do painel **Environments** não é suportada para Jobs programados de GPU serverless. Dependências devem ser instaladas programaticamente no seu Notebook (por exemplo, %pip install). A recuperação automática não é suportada — se seu Job falhar devido a pacotes incompatíveis, você deve corrigir e executar novamente manualmente.
Para cargas de trabalho que possam exceder o tempo de execução máximo de 7 dias, implemente o ponto de verificação manual para permitir a retomada. Recomendamos o uso de volumes do Unity Catalog por meio de UCVolumeWriter e UCVolumeReader de serverless_gpu.data. Ver Ponto de verificação de modelo.
Pacotes ativos API de empregos e Databricks
Você pode criar e gerenciar tarefas Runtime AI programaticamente usando a APIde TarefasDatabricks ou os Pacotes AtivosDatabricks. Configure o tipo compute como GPU serverless na definição do seu Job ou pacote para automatizar o pipeline de implantação.
O exemplo a seguir mostra uma configuração de pacote de ativos do Databricks para um Job de Runtime de AI em GPU serverless usando o ambiente Standard:
resources:
jobs:
sample_job:
name: sample_job_h100
trigger:
periodic:
interval: 1
unit: DAYS
parameters:
- name: catalog
default: ${var.catalog}
- name: schema
default: ${var.schema}
environments:
- environment_key: default
spec:
environment_version: '4'
tasks:
- task_key: notebook_task
notebook_task:
notebook_path: /Workspace/Users/your_email/your_notebook
environment_key: default
compute:
hardware_accelerator: GPU_8xH100
Para usar o ambiente de AI do Databricks em vez do ambiente Standard, defina base_environment como o identificador de ambiente de AI (por exemplo, databricks_ai_v5 para AI v5) no ambiente spec e faça referência a ele a partir do environment_key da tarefa:
Beta
Selecionar um ambiente de AI do Databricks como um ambiente base de workspace está em Beta e requer que um administrador do workspace se inscreva. Consulte Construa para compute de GPU serverless (AI Runtime).
resources:
jobs:
sample_job:
name: sample_job_aiv5_h100
trigger:
periodic:
interval: 1
unit: DAYS
parameters:
- name: catalog
default: ${var.catalog}
- name: schema
default: ${var.schema}
environments:
- environment_key: aiv5
spec:
base_environment: databricks_ai_v5
tasks:
- task_key: notebook_task
notebook_task:
notebook_path: /Workspace/Users/your_email/your_notebook
environment_key: aiv5
compute:
hardware_accelerator: GPU_8xH100