基盤モデルファインチューニング

備考

プレビュー

この機能は、us-east-1 と us-west-2でパブリックプレビュー段階です。

基盤モデルファインチューニング (現在は Mosaic AI Model トレーニングの一部) を使用すると、独自のデータを使用して基盤モデルをカスタマイズし、特定のアプリケーションに合わせてパフォーマンスを最適化できます。基盤モデルのファインチューニングや継続的なトレーニングを行うことで、モデルを一からトレーニングするよりも大幅に少ないデータ、時間、コンピュートリソースで自分のモデルをトレーニングすることができます。

Databricksを使用すると、トレーニングに使用する独自のデータ、基盤モデルをトレーニングする、MLflowに保存されたチェックポイント、Unity Catalogに登録されすぐにデプロイできるモデルなど、すべてが1つのプラットフォームにまとめられます。

基盤モデルファインチューニングを使用して実行を作成する方法を学習するには、チュートリアル: 基盤モデルファインチューニング実行の作成とデプロイAPI を参照し、結果を確認してDatabricks UI とMosaic AI Model Serving を使用してモデルをデプロイします。

基盤モデルファインチューニングとは?

基盤モデルファインチューニングでは、 Databricks API または UI を使用して、基盤モデルをチューニングしたり、さらに学習させたりすることができます。

基盤モデルファインチューニングを使用すると、次のことができます。

MLflowに保存されたチェックポイントを使用して、カスタムデータでモデルをトレーニングします。トレーニングされたモデルを完全にコントロールすることができます。
モデルを Unity Catalog に自動的に登録し、モデルサービングによる簡単なデプロイを可能にします。
以前に訓練したモデルの加重をロードして、完成した独自のモデルをさらに訓練します。

Databricksでは、次の場合は基盤モデルファインチューニングを試すことをお勧めします。

数回の試行で学習を試みて、より良い結果を得たいと考えています。
既存のモデルでプロンプトエンジニアリングを試し、より良い結果を求めています。
データのプライバシーのためにカスタムモデルを完全に所有したい。
あなたはレイテンシーやコストに敏感で、タスク固有のデータには小さくて安価なモデルを使いたいと思っています。

サポートされているタスク

基盤モデルファインチューニングは、以下のユースケースをサポートします。

チャット完了 ：推奨タスク。ユーザーとAIアシスタントとのチャットログを使用してモデルをトレーニングします。このフォーマットは実際のチャットログ用途と、質問への回答や会話テキストの標準フォーマットとしての用途の両方に使用できます。テキストは自動的に特定のモデルに適したフォーマットにフォーマットされます。テンプレートの詳細については、HuggingFaceドキュメントの「チャットテンプレートの例」を参照してください。
指示ファインチューニング : 構造化されたプロンプト応答データでモデルをトレーニングします。これを使用して、モデルを新しいタスクに適合させたり、応答スタイルを変更したり、指示追従機能を追加したりします。このタスクは、データに書式設定を自動的に適用することはなく、カスタムデータの書式設定が必要な場合にのみ推奨されます。
継続的な事前トレーニング ：追加のテキストデータでモデルをトレーニングするしてください。これを使用して、モデルに新しい知識を追加したり、モデルを特定のドメインに集中させたりします。

必要条件

Databricksワークスペースが以下のAWSリージョンのいずれかにある: us-east-1とus-west-2。
基盤モデルファインチューニング API pip install databricks_genaiを使用してインストールします。
ワークスペースはS3アクセスポリシーを使用してはいけません。
データがDelta テーブルにある場合は、Databricks Runtime 12.2 LTS ML以降。

必要な入力データ形式については、基盤モデルファインチューニングのためのデータの準備を参照してください。

モデルトレーニングに推奨されるデータサイズ

Databricks では、最初に 1 から 4 エポックを使用してトレーニングすることをお勧めします。微調整されたモデルを評価した後、モデル出力をトレーニングデータにより類似させたい場合は、さらに 1 つまたは 2 つのエポックを使用してトレーニングを続行できます。

ファインチューニングデータに表されていないタスクでモデルのパフォーマンスが大幅に低下する場合、またはモデルがファインチューニングデータの正確なコピーを出力しているように見える場合、Databricks ではトレーニングエポックの数を減らすことをお勧めします。

命令のファインチューニングとチャットの完了には、モデルの少なくとも 1 つの完全なコンテキスト長に対して十分なトークンを提供する必要があります。たとえば、 meta-llama/Llama-3.2-3B-Instructの 131072 トークンです。

事前トレーニングを継続するために、Databricks では、カスタムデータを学習する高品質のモデルを取得するために、最低 150 万トークンを推奨しています。

サポートされているモデル

次の表に、サポートされているモデルを示します。該当するモデル・ライセンスおよびアクセプタブル・ユース・ポリシー情報については、モデル・ライセンスを参照してください。

最先端のモデルのサポートを継続するために、Databricks はサポートされているモデルを更新するか、古いモデルを廃止する場合があります。

モデル	最大コンテキスト長	注
`meta-llama/Llama-3.3-70B-Instruct`	131072
`meta-llama/Llama-3.2-1B`	131072
`meta-llama/Llama-3.2-1B-Instruct`	131072
`meta-llama/Llama-3.2-3B`	131072
`meta-llama/Llama-3.2-3B-Instruct`	131072
`meta-llama/Meta-Llama-3.1-70B`	131072
`meta-llama/Meta-Llama-3.1-70B-Instruct`	131072
`meta-llama/Meta-Llama-3.1-8B`	131072
`meta-llama/Meta-Llama-3.1-8B-Instruct`	131072

モデルライセンス

次の表に、サポートされているモデルファミリの適用可能なモデルライセンスと許容される使用ポリシー情報を示します。

モデルファミリー	ライセンスと利用規約
メタ Llama 3.2	Meta Llama 3.2 は、 LLAMA 3.2 コミュニティライセンス、Copyright © Meta Platforms, Inc. の下でライセンスされています。全著作権所有。お客様は、本ライセンスおよび Llama 3.2 利用規約の条項に対するコンプライアンスを確保する責任があります。
Meta Llama 3.1	Meta Llama 3.1 は、LLAMA 3.1 コミュニティライセンス、Copyright © Meta Platforms, Inc. の下でライセンスされています。全著作権所有。お客様は、該当するモデルライセンスにコンプライアンスしていることを確認する責任があります。

基盤モデルファインチューニングを使う

基盤モデルファインチューニングは、databricks_genai SDKを使用してアクセスできます。次の例では、Unity Catalog ボリュームのデータを使用するトレーニング実行を作成して起動します。構成の詳細については、「基盤モデルファインチューニング APIを使用したトレーニング実行の作成」を参照してください。

Python
from databricks.model_training import foundation_model as fm

model = 'meta-llama/Meta-Llama-3.1-8B-Instruct'
# UC Volume with JSONL formatted data
train_data_path = 'dbfs:/Volumes/main/mydirectory/ift/train.jsonl'
register_to = 'main.mydirectory'
run = fm.create(
  model=model,
  train_data_path=train_data_path,
  register_to=register_to,
)

データの準備、ファインチューニングトレーニング実行設定、およびデプロイメントを説明する指示を微調整の例については、指示ファインチューニング：固有表現抽出デモノートブックを参照してください。

制限

大規模なデータセット（10B以上のトークン）は、コンピューティングの可用性のためサポートされていません。
継続的な事前トレーニングの場合、ワークロードは 60 から 256 MB のファイルに制限されます。 1GBを超えるファイルは、処理時間が長くなる可能性があります。
Databricks は、基盤モデルファインチューニングを使用して、最新の最新モデルをカスタマイズできるように努めています。新しいモデルが利用可能になると、API または UI からの古いモデルへのアクセスが削除されたり、古いモデルが非推奨になったり、サポートされているモデルが更新されたりする可能性があります。生成AIモデルのメンテナンスポリシーを参照してください。
AWS PrivateLink が有効な Databricks ワークスペースで基盤モデルファインチューニングを使用するには、ワークスペースがus-west-2リージョンに存在する必要があります。
ストレージに AWS PrivateLink が設定されている場合、Databricks では Unity Catalog テーブルの使用をお勧めします。
Unity Catalogにデータを保存するストレージアカウントでファイアウォールが有効になっている場合は、Databricks サーバレスデータプレーンクラスターからのトラフィックを許可リストに登録して、基盤モデルファインチューニングを使用する必要があります。Databricks アカウントチームに連絡して、詳細情報と可能なカスタムソリューションを確認してください。

基盤モデル ファインチューニングとは?​

サポートされているタスク​

必要条件​

モデルトレーニングに推奨されるデータサイズ​

サポートされているモデル​

モデルライセンス​

基盤モデル ファインチューニングを使う​

制限​