基盤モデル トレーニング UI を使用してトレーニング 実行を作成する

重要

この機能は パブリック プレビュー段階です。 パブリック プレビューに登録するには、Databricks アカウント チームにお問い合わせください。

この記事では、基盤モデル トレーニング UI を使用してトレーニング 実行を作成および構成する方法について説明します。 API を使用して実行を作成することもできます。 手順については、 「基盤モデル トレーニングAPIを使用してトレーニング実行を作成する」を参照してください。

要件

要件」を参照してください。

UIを使用してトレーニング実行を作成する

UI を使用してトレーニング 実行を作成するには、次の手順に従います。

  1. 左側のサイドバーで、 「拡張機能」をクリックします。

  2. 基盤モデル トレーニングカードで、 [基盤モデル エクスペリメントの作成] をクリックします。

    基盤モデル 実験形式
  3. 基盤モデルトレーニングフォームが開きます。アスタリスクの付いた項目は必須です。 選択を行い、 「トレーニングを開始」をクリックします。

    タイプ: 実行するタスクを選択します。

    タスク

    説明

    指示のファインチューニング

    プロンプトと応答の入力を使用して基盤モデルのトレーニングを継続し、特定のタスクに合わせてモデルを最適化します。

    継続的な事前学習

    基盤モデルのトレーニングを継続して、ドメイン固有の知識を付与します。

    チャット完了

    チャット ログを使用して基盤モデルのトレーニングを継続し、Q&A または会話アプリケーション向けに最適化します。

    基盤モデルの選択: チューニングまたはトレーニングするモデルを選択します。 サポートされているモデルの一覧については、「 サポートされているモデル」を参照してください。

    トレーニング データ: [参照]をクリックしてUnity Catalog内のテーブルを選択するか、 Hugging Faceデータセットの完全な URL を入力します。 データ サイズの推奨事項については、 「モデル トレーニングに推奨されるデータ サイズ」を参照してください。

    Unity Catalogでテーブルを選択した場合は、テーブルの読み取りに使用するコンピュートも選択する必要があります。

    登録する場所: ドロップダウン メニューからUnity Catalogカタログとスキーマを選択します。 トレーニング済みのモデルは、この場所に保存されます。

    モデル名: モデルは、指定したカタログとスキーマにこの名前で保存されます。 このフィールドにはデフォルトの名前が表示されますが、必要に応じて変更できます。

    詳細オプション: さらなるカスタマイズのために、既存の独自モデルからの評価、ハイパーパラメータ調整、またはトレーニングのオプション設定を構成できます。

    設定

    説明

    トレーニング期間

    トレーニング実行の期間。エポック (例: 10ep ) またはトークン (例: 1000000tok ) で指定します。 デフォルトは1epです。

    学習率

    モデルトレーニングの学習率。 デフォルトは5e-7です。 オプティマイザーは DecoupledLionW で、ベータは 0.99 と 0.95 で、重み減衰はありません。 学習率スケジューラは、ウォームアップが合計トレーニング期間の 2%、最終学習率乗数が 0 の LinearWithWarmupSchedule です。

    コンテキストの長さ

    データ・サンプルの最大シーケンス長。 この設定より長いデータは切り捨てられます。 デフォルトは選択したモデルによって異なります。

    評価データ

    [参照]をクリックしてUnity Catalog内のテーブルを選択するか、 Hugging Faceテーブルの完全な URL を入力します。 このフィールドを空白のままにすると、評価は実行されません。

    モデルの評価プロンプト

    モデルの評価に使用するオプションのプロンプトを入力します。

    エクスペリメント名

    デフォルトでは、実行ごとに新しい自動生成された名前が割り当てられます。 オプションでカスタム名を入力するか、ドロップダウン リストから既存の拡張機能を選択できます。

    カスタムウェイト

    デフォルトでは、選択したモデルの元の重みを使用してトレーニングが開始されます。 Composer チェックポイントからカスタム ウェイトを開始するには、チェックポイント値を含むUnity Catalogテーブルへのパスを入力します。