Conecte-se ao AI Runtime
Pré-visualização pública
Runtime AI para tarefas de nó único está em versão prévia pública. A API de treinamento distribuído para cargas de trabalho com múltiplas GPUs permanece em versão Beta.
Este artigo descreve como conectar-se ao AI Runtime a partir de um Notebook interativo, um Job agendado e a API de Jobs.
Interativo (Notebook)
Esta é a principal forma de usar o AI Runtime. Para conectar seu notebook e configurar o ambiente:
- Em um notebook, clique no menu suspenso Conectar na parte superior e selecione GPU sem servidor .
- Clique no
Para abrir o painel lateral Ambiente .
- Selecione A10 ou H100 no campo Acelerador .
- Selecione "Nenhum" para o ambientedefault ou AI v4" para o ambienteAI no campo "Ambiente base" .
- Clique em Aplicar e, em seguida, confirme que deseja aplicar o AI Runtime ao seu ambiente de notebook.
A conexão com seu compute será encerrada automaticamente após 60 minutos de inatividade.
Para operações que não exigem GPUs (por exemplo, clonar um repositório Git , converter formatos de dados ou realizar análise exploratória de dados), conecte seu Notebook a um cluster de CPUs para preservar os recursos de GPU.
Tarefas (Agendadas)
Você pode programar um Notebook que utilize uma GPU serverless como tarefa recorrente. Consulte Criar e gerenciar tarefas agendadas do Notebook para obter mais detalhes.
Após abrir o Bloco de Anotações que deseja usar:
- Selecione o botão "Programar" no canto superior direito.
- Selecione Adicionar programar .
- Preencha o formulário Novo programar com o nomeJob , programar e compute .
- Selecione Criar .
Você também pode criar e programar trabalhos a partir da interface de trabalho de trabalhos e pipelines . Consulte Criar um novo trabalho para obter orientações passo a passo.
A adição de dependências usando o painel Ambientes não é compatível com trabalhos agendados por GPU em serverless . As dependências devem ser instaladas programaticamente dentro do seu Notebook (por exemplo, %pip install). A recuperação automática não é suportada — se o seu trabalho falhar devido a um pacote incompatível, você deverá corrigi-lo manualmente e executá-lo novamente. Para cargas de trabalho que possam exceder o tempo máximo de execução de 7 dias, implemente o checkpoint manual para permitir a retomada.
Pacotes ativos API de empregos e Databricks
Você pode criar e gerenciar tarefas Runtime AI programaticamente usando a APIde TarefasDatabricks ou os Pacotes AtivosDatabricks. Configure o tipo compute como GPU serverless na definição do seu Job ou pacote para automatizar o pipeline de implantação.
O exemplo a seguir mostra uma configuração de um Databricks Ativo Bundle para um AI Runtime em um Job de GPU serverless :
resources:
jobs:
sample_job:
name: sample_job_h100
trigger:
periodic:
interval: 1
unit: DAYS
parameters:
- name: catalog
default: ${var.catalog}
- name: schema
default: ${var.schema}
environments:
- environment_key: default
spec:
environment_version: '4'
tasks:
- task_key: notebook_task
notebook_task:
notebook_path: /Workspace/Users/your_email/your_notebook
environment_key: default
compute:
hardware_accelerator: GPU_8xH100