AI モデルと ML モデルのトレーニング

このセクションでは、Mosaic AI で機械学習モデルと AI モデルをトレーニングする方法を示します。

Mosaic AIModel トレーニングは、ML AutoMLおよび基盤モデルのファインチューニングワークロードを通じて、従来のモデルのトレーニングとデプロイのプロセスを合理化および統合します。

AutoML

AutoML は、最適なアルゴリズムとハイパーパラメータ設定を自動的に見つけることで、データセットに機械学習を適用するプロセスを簡素化します。 AutoML は、Python API だけでなく、ノーコード UI も提供します。

基盤モデルファインチューニング

Databricksにおける基盤モデルのファインチューニング (現在はMosaic AI Model トレーニングの一部)を使用すると、独自のデータを使用して大規模言語モデル (LLM) をカスタマイズできます。このプロセスでは、既存の基盤モデルのトレーニングをファインチューニングすることで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、およびコンピュートリソースを大幅に削減します。主な機能は次のとおりです。

指示によるファインチューニング: 構造化されたプロンプト応答データでトレーニングを行うことで、モデルを新しいタスクに適応させます。
継続的な事前トレーニング： 新しい知識を追加したり、特定の分野に焦点を当てたりするために、追加のテキストデータでモデルを強化できます。
チャットコンプリーション： 会話能力を向上させるために、チャットログでモデルをトレーニングします。

オープンソースライブラリの例

Optuna とHyperoptを使用したハイパーパラメーターチューニングの例など、さまざまなオープンソース機械学習ライブラリの機械学習トレーニングの例を参照してください。

ディープラーニング

分散ディープラーニングトレーニングの例とベストプラクティスを参照して、Databricksでディープラーニングモデルを開発および微調整できるようにします。

AutoML​

基盤モデル ファインチューニング​

オープンソースライブラリの例​

ディープラーニング​

推薦​

AutoML

基盤モデルファインチューニング

オープンソースライブラリの例

ディープラーニング

推薦