AI Runtime CLI クイックスタート
備考
ベータ版
AI Runtime CLI は ベータ版です。
このページでは、AI Runtime CLI を使用して、初めてのトレーニング ジョブを送信する方法について説明します。開始する前に、CLI をインストールして認証を構成します。
ステップ1: YAML設定を作成する
ワークロードを説明するtrain.yamlを作成する。最小限の構成には、エクスペリメント名、環境、コンピュート仕様、およびコマンドが必要です。
YAML
experiment_name: my-first-air-run
compute:
num_accelerators: 1
accelerator_type: GPU_1xA10
command: echo "hello AIR!"
フィールドの完全な参照については、 「ワークロード YAML リファレンス」を参照してください。
ステップ2:実行を提出する
ワークロードを送信してください:
Bash
air run --file train.yaml
CLI はローカルコードをアップロードし、ジョブを送信し、実行 ID を出力します。
ログが完了するまで監視するには、--watchを追加します:
Bash
air run --file train.yaml --watch
ステップ 3: 実行を検証する
ステータスを確認:
Bash
air get run <run-id>
ログのストリームまたはダウンロード:
Bash
air logs <run-id>
air logs <run-id> --node 2
air logs <run-id> --download-only ./logs/
最近の実行の一覧表示:
Bash
air list runs --limit 10
air list runs --active
実行をキャンセル:
Bash
air cancel <run-id>
一般的なパターン
コマンドラインから YAML フィールドを上書きする:
Bash
air run --file train.yaml --override compute.num_accelerators=32 timeout_minutes=120
設定を送信なしで検証:
Bash
air run --file train.yaml --dry-run
送信を安全に再試行可能にする:
Bash
air run --file train.yaml --idempotency-key my-unique-key
同じキーが以前に使用されている場合、新しい実行を作成するのではなく、既存の実行が返されます。