ステップバイステップ: Databricksでの AI と機械学習

この記事では、Databricks で AI と LLM のソリューションをネイティブに構築する方法を学習するのに役立つ記事を紹介します。トピックには、データの準備とモデルの構築からデプロイ、モニタリング、MLOps まで、エンドツーエンドの AI ライフサイクルの主要なステップが含まれます。

モデルトレーニング用のデータを準備する

ファインチューニング LLM のデータ準備など、AI ワークロード用のデータを読み込んで処理する方法を学びます。モデルトレーニング用にデータを準備する方法

特徴量エンジニアリング

Unity Catalog で利用できる特徴エンジニアリングを使用して、特徴量テーブルの作成方法、特徴のリネージの追跡方法、他のユーザーが既に構築した機能の検出方法を学びます。

Unity Catalogでの特徴量エンジニアリング

モデルをトレーニングして登録する

AutoML を使用して機械学習モデルの効率的なトレーニングとチューニングを行う方法と、MLflow を使用してエクスペリメント追跡を行う方法について説明します。

本番用のリアルタイムまたはバッチサービング

リアルタイムワークロードにモデルサービングを使用する方法を開始するか、オフライン推論用に MLflow モデルをデプロイします。

大規模言語モデル (LLM)のセルフホスティング

Databricks 環境内でオープンソースの LLM を安全かつコスト効率よくホストする方法を学びます

GPU モデルサービング

デプロイされたモデルの監視

本番運用でAIモデルを監視する方法を学びます。推論テーブルを使用して、モデルサービングエンドポイントの入力と予測を継続的にキャプチャしてデルタテーブルに記録し、モデルのパフォーマンスメトリクスを常に把握できるようにします。レイクハウスモニタリング、目的のベンチマークを満たしているかどうかもわかります。