Início rápido da CLI do AI Runtime
Beta
O AI Runtime CLI está em Beta.
Esta página aborda a submissão do seu primeiro Job de treinamento com a CLI do AI Runtime. Antes de começar, instale a CLI e configure a autenticação.
O passo 1: Escrever uma configuração YAML
Crie train.yaml descrevendo a carga de trabalho. A configuração mínima exige um nome de experimento, um ambiente, uma especificação de compute e um comando:
experiment_name: my-first-air-run
compute:
num_accelerators: 1
accelerator_type: GPU_1xA10
command: echo "hello AIR!"
Para a referência de campo completa, consulte a referência YAML da carga de trabalho.
Etapa 2: Enviar a execução
Submeta a carga de trabalho:
air run --file train.yaml
A CLI faz o upload do seu código local, envia o job e imprime um ID de execução.
Para acompanhar os logs até a conclusão, adicione --watch:
air run --file train.yaml --watch
Etapa 3: inspecionar a execução
Verifique o status:
air get run <run-id>
Transmissão ou downloads de logs:
air logs <run-id>
air logs <run-id> --node 2
air logs <run-id> --download-only ./logs/
Listar execuções recentes:
air list runs --limit 10
air list runs --active
Cancelar execução:
air cancel <run-id>
Padrões comuns
Substituir campos YAML a partir da linha de comando:
air run --file train.yaml --override compute.num_accelerators=32 timeout_minutes=120
Validar a configuração sem enviar:
air run --file train.yaml --dry-run
Tornar um envio seguramente repetível:
air run --file train.yaml --idempotency-key my-unique-key
Se a mesma key já foi usada antes, a execução existente é retornada em vez de criar uma nova.