Mosaic AIモデル トレーニング UI を使用してトレーニング実行を作成する
重要
この機能は パブリック プレビュー段階です。 パブリック プレビューに登録するには、Databricks アカウント チームにお問い合わせください。
この記事では、 Mosaic AIモデル トレーニング (旧基盤モデル トレーニング) UI を使用してトレーニング実行を作成および構成する方法について説明します。 API を使用して実行を作成することもできます。 手順については、 「 Mosaic AIモデル トレーニングAPIを使用したトレーニング実行の作成」を参照してください。
要件
「 要件」を参照してください。
UIを使用してトレーニング実行を作成する
UI を使用してトレーニング 実行を作成するには、次の手順に従います。
左側のサイドバーで、 「拡張機能」をクリックします。
Mosaic AIモデル トレーニングカードで、 Mosaic AIモデルの作成] エクスペリメントをクリックします。
Mosaic AI モデル トレーニングフォームが開きます。アスタリスクが付いている項目は必須です。 選択を行い、 「トレーニングを開始」をクリックします。
タイプ: 実行するタスクを選択します。
タスク
説明
指示 ファインチューニング
プロンプトと応答の入力を使用して基盤モデルのトレーニングを継続し、特定のタスクに合わせてモデルを最適化します。
継続的な事前学習
基盤モデルのトレーニングを継続して、ドメイン固有の知識を付与します。
チャット完了
チャット ログを使用して基盤モデルのトレーニングを継続し、Q&A または会話アプリケーション向けに最適化します。
基盤モデルの選択: チューニングまたはトレーニングするモデルを選択します。 サポートされているモデルの一覧については、「 サポートされているモデル」を参照してください。
トレーニング データ: [参照]をクリックしてUnity Catalog内のテーブルを選択するか、 Hugging Faceデータセットの完全な URL を入力します。 データ サイズの推奨事項については、 「モデル トレーニングに推奨されるデータ サイズ」を参照してください。
Unity Catalogでテーブルを選択した場合は、テーブルの読み取りに使用するコンピュートも選択する必要があります。
登録する場所: ドロップダウン メニューからUnity Catalogカタログとスキーマを選択します。 トレーニング済みのモデルは、この場所に保存されます。
モデル名: モデルは、指定したカタログとスキーマにこの名前で保存されます。 このフィールドにはデフォルトの名前が表示されますが、必要に応じて変更できます。
詳細オプション: さらなるカスタマイズのために、既存の独自モデルからの評価、ハイパーパラメータ調整、またはトレーニングのオプション設定を構成できます。
設定
説明
トレーニング期間
トレーニング実行の期間。エポック (例:
10ep
) またはトークン (例:1000000tok
) で指定します。 デフォルトは1ep
です。学習率
モデルトレーニングの学習率。 デフォルトは
5e-7
です。 オプティマイザーは DecoupledLionW で、ベータは 0.99 と 0.95 で、重み減衰はありません。 学習率スケジューラは、ウォームアップが合計トレーニング期間の 2%、最終学習率乗数が 0 の LinearWithWarmupSchedule です。コンテキストの長さ
データ・サンプルの最大シーケンス長。 この設定より長いデータは切り捨てられます。 デフォルトは選択したモデルによって異なります。
評価データ
[参照]をクリックしてUnity Catalog内のテーブルを選択するか、 Hugging Faceテーブルの完全な URL を入力します。 このフィールドを空白のままにすると、評価は実行されません。
モデルの評価プロンプト
モデルの評価に使用するオプションのプロンプトを入力します。
エクスペリメント名
デフォルトでは、実行ごとに新しい自動生成された名前が割り当てられます。 オプションでカスタム名を入力するか、ドロップダウン リストから既存の拡張機能を選択できます。
カスタムウェイト
デフォルトでは、選択したモデルの元の重みを使用してトレーニングが開始されます。 Composer チェックポイントからカスタム ウェイトを開始するには、チェックポイント値を含むUnity Catalogテーブルへのパスを入力します。