AI/MLモデルのトレーニング
このセクションでは、Mosaic AI で機械学習モデルと AI モデルをトレーニングする方法を示します。
モザイクAutoML
Mosaic AutoML は、最適なアルゴリズムとハイパーパラメータ設定を自動的に見つけることで、データセットに機械学習を適用するプロセスを簡素化します。 AutoML は、ローコード UI と Python API を提供します。
Mosaic AIモデルトレーニング
Mosaic AI Model トレーニング (旧 基盤モデル トレーニング) on Databricks は、独自のデータを使用して大規模言語モデル (LLMs) をカスタマイズすることができます。このプロセスでは、既存の基盤モデルのトレーニングをファインチューニングすることで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、およびコンピュートリソースを大幅に削減します。 主な機能は次のとおりです。
教師ありの微調整:構造化されたプロンプトとレスポンスデータでトレーニングすることで、モデルを新しいタスクに適応させることができます。
継続的な事前トレーニング:新しい知識を追加したり、特定の分野に焦点を当てたりするために、追加のテキストデータでモデルを強化できます。
チャット完了:会話能力を向上させるために、チャットログでモデルをトレーニングします。
オープンソースライブラリの例
Optuna と を使用したハイパーパラメーターチューニングの例など、さまざまなオープンソース 機械学習ライブラリの 機械学習 トレーニングの例 を参照してください。Hyperopt
ディープラーニング
分散ディープラーニング トレーニングの例とベスト プラクティスを参照して、Databricksでディープラーニング モデルを開発および微調整できるようにします。
推薦
Databricks で ディープラーニングベースのレコメンデーション モデルを トレーニングする方法について説明します。 従来のレコメンデーション モデルと比較して、ディープラーニング モデルは、より高品質の結果を達成し、大量のデータにスケーリングできます。