チュートリアル: 基盤モデル トレーニング を使用してトレーニング 実行を作成して展開する

重要

この機能は パブリック プレビュー段階です。 パブリック プレビューに登録するには、Databricks アカウント チームにお問い合わせください。

この記事では、基盤モデル トレーニングAPIを使用して実行を作成および構成し、その結果を確認してDatabricks UI とDatabricksモデルサーバーを使用してモデルをデプロイする方法について説明します。

要件

ステップ1: トレーニング用のデータを準備する

「基盤モデルトレーニング用のデータの準備」を参照してください。

ステップ 2: databricks_genai SDK をインストールする

databricks_genai SDK をインストールするには、以下を使用します。

%pip install databricks_genai

次に、 foundation_modelライブラリをインポートします。

dbutils.library.restartPython()
from databricks.model_training import foundation_model as fm

ステップ3: トレーニング実行を作成する

基盤モデル トレーニング のcreate()関数を使用して トレーニング 実行 を作成します。 以下のものが必要です:

  • model: トレーニングするモデル。

  • train_data_path: トレーニング データセットの場所です。

  • register_to: チェックポイントを保存する Unity Catalog カタログとスキーマ。

例えば:

run = fm.create(model='meta-llama/Llama-2-7b-chat-hf',
                train_data_path='dbfs:/Volumes/main/my-directory/ift/train.jsonl', # UC Volume with JSONL formatted data
                register_to='main.my-directory',
                training_duration='1ep')

run

ステップ4: 実行のステータスを表示する

トレーニング実行を完了するのにかかる時間は、トークンの数、モデル、GPU の可用性によって異なります。 トレーニングを高速化するために、 Databricksでは予約済みのコンピュートを使用することをお勧めします。 詳細については、Databricks アカウント チームにお問い合わせください。

実行を開始した後、 get_events()を使用して実行のステータスを監視できます。

run.get_events()

ステップ5: メトリックと出力を表示する

Databricks UI で結果を表示するには、次の手順に従います。

  1. Databricksワークスペースで、左側のナビゲーション バーの[拡張機能]をクリックします。

  2. リストからエクスペリメントを選択してください。

  3. [チャート]タブでメトリック チャートを確認します。

    1. 進捗状況を示す主なトレーニング指標は損失です。 評価損失を使用すると、モデルがトレーニング データに過剰適合しているかどうかを確認できます。 ただし、教師ありトレーニング タスクでは、モデルが改善し続ける一方で評価損失が過剰適合しているように見える可能性があるため、損失に完全に依存すべきではありません。

    2. このタブでは、評価プロンプトを指定した場合、その出力も表示できます。

ステップ6: MLflow LLMを使用して複数のカスタマイズされたモデルを評価する デプロイ前に評価する

「 MLflowを使用して大規模言語モデルを評価する」を参照してください。

ステップ7: モデルをデプロイする

トレーニングの実行が完了すると、モデルがUnity Catalogに自動的に登録されます。 モデルは、実行create()メソッドのregister_toフィールドに指定した内容に基づいて登録されます。

モデルをデプロイして提供するには、次の手順に従います。

  1. Unity Catalog内のモデルに移動します。

  2. [ このモデルを提供する] をクリックします。

  3. [ 配信エンドポイントを作成] をクリックします。

  4. [ 名前 ] フィールドに、エンドポイントの名前を入力します。

  5. [作成]をクリックします。