Mosaic AIモデルトレーニングUIを使用してトレーニング実行を作成する

重要

この機能はus-east-1us-west-2パブリックプレビュー段階です。

この記事では、Mosaic AIモデルトレーニング(旧基盤モデルトレーニング)のUIを使用してトレーニング実行を作成し、設定する方法について説明します。APIを使用して実行を作成することもできます。手順については、Mosaic AIモデルトレーニング APIを使用してトレーニング実行を作成するを参照してください。

要件

要件を参照してください。

UIを使用してトレーニング実行を作成する

UIを使用してトレーニング実行を作成するには、次のステップに従います。

  1. 左のサイドバーでエクスペリメントをクリックします。

  2. [Mosaic AIモデルトレーニング] カードで、[Mosaic AIモデルのエクスペリメントを作成] をクリックします。

    基盤モデルエクスペリメントフォーム
  3. Mosaic AIモデルトレーニングフォームが開きます。アスタリスクの付いている項目は必須です。選択し、[トレーニングを開始] をクリックします。

    タイプ:実行するタスクを選択します。

    タスク

    説明

    指示を微調整

    特定のタスクに合わせてモデルを最適化するために、即応型のインプットを使って基盤モデルのトレーニングを続けてください。

    継続的な事前学習

    基礎モデルのトレーニングを継続して、ドメイン固有の知識を付与します。

    チャット完了

    Q&Aや会話アプリケーションに最適化するために、チャットログを使って基盤モデルのトレーニングを続けてください。

    基盤モデルの選択:チューニングまたはトレーニングするモデルを選択します。サポートされているモデルの一覧については、サポートされているモデルを参照してください。

    トレーニングデータ:[参照]をクリックして Unity Catalogのテーブルを選択するか、Hugging Faceデータセットの完全なURLを入力します。データサイズの推奨事項については、モデルトレーニングの推奨データサイズを参照してください。

    Unity Catalogでテーブルを選択する場合は、テーブルの読み取りに使用するコンピュートも選択する必要があります。

    ロケーションに登録:ドロップダウンメニューからUnity Catalogのカタログとスキーマを選択します。トレーニング済みのモデルは、この場所に保存されます。

    モデル名:モデルは、指定したカタログとスキーマにこの名前で保存されます。このフィールドにはデフォルトの名前が表示されますが、必要に応じて変更できます。

    高度なオプション:さらにカスタマイズするために、評価、ハイパーパラメーターチューニング、または既存の独自モデルからのトレーニングのためのオプション設定を構成することができます。

    設定

    説明

    トレーニング期間

    エポック(例えば10epなど)またはトークン(1000000tokなど)で指定されるトレーニング実行の期間。デフォルトは1epです。

    学習率

    モデルトレーニングの学習率です。デフォルトは5e-7です。オプティマイザーはデカップリングされたLionWで、ベータは0.99と0.95で、加重の減衰はありません。学習率スケジューラは、ウォームアップが合計トレーニング期間の2%、最終学習率乗数が0のLinearWithWarmupScheduleです。

    コンテキストの長さ

    データサンプルのシーケンスの最大長です。この設定より長いデータは切り捨てられます。デフォルトは、選択したモデルによって異なります。

    評価データ

    [参照]をクリックしてUnity Catalogのテーブルを選択するか、Hugging Faceデータセットの完全なURLを入力します。このフィールドを空白のままにすると、評価は実行されません。

    モデルの評価プロンプト

    モデルの評価に使用するオプションのプロンプトを入力します。

    エクスペリメント名

    デフォルトでは、実行ごとに新しい自動生成された名前が割り当てられます。必要に応じて、カスタム名を入力するか、ドロップダウンリストから既存のエクスペリメントを選択することもできます。

    カスタム加重

    デフォルトでは、選択したモデルの元の加重を使用してトレーニングが開始されます。Composerのチェックポイントからカスタム加重を開始するには、チェックポイント値を含むUnity Catalogテーブルへのパスを入力します。

次のステップ

トレーニングの実行が完了したら、MLflowでメトリックを確認し、推論用にモデルをデプロイできます。チュートリアル:Mosaic AIモデルトレーニングの実行を作成してデプロイするのステップ5~7を参照してください。

データの準備、微調整トレーニング実行設定、およびデプロイメントを説明する指示を微調整の例については、指示を微調整:エンティティを識別できる名前デモノートブックを参照してください。