Databricksでの生成AIアプリ構築入門

Databricksは、生成AIアプリケーションを構築、デプロイ、管理するための包括的なプラットフォームを提供します。この記事では、Databricks上で生成AIアプリケーションを開発するために必要なコンポーネントとプロセスについて説明します。

Mosaic AIモデルトレーニング

Mosaic AIの モデル トレーニング (旧基盤モデル トレーニング)Databricks を使用すると、独自のデータを使用して大規模言語モデル (LLM) をカスタマイズできます。このプロセスには、既存の基盤モデルのトレーニングの微調整が含まれ、モデルを最初からトレーニングする場合と比較して、必要なデータ、時間、コンピュート リソースが大幅に削減されます。 主な機能は次のとおりです。

  • 教師ありの微調整:構造化されたプロンプトとレスポンスデータでトレーニングすることで、モデルを新しいタスクに適応させることができます。

  • 継続的な事前トレーニング:新しい知識を追加したり、特定の分野に焦点を当てたりするために、追加のテキストデータでモデルを強化できます。

  • チャット完了:会話能力を向上させるために、チャットログでモデルをトレーニングします。

外部モデルの統合

Databricksは外部モデルの統合をサポートしており、Databricksの外部でホストされているサードパーティのモデルを活用することができます。これにより、OpenAIやAnthropicといった様々なLLMプロバイダーの組織内での利用や管理が効率化されます。

Mosaic AI エージェントフレームワーク

エージェントフレームワークは、検索拡張生成(RAG)アプリケーションのようなプロダクション品質のエージェントの構築、デプロイ、評価を支援するために設計されたDatabricks上のツールセットです。

高品質のエージェントを構築するには、エージェントシステムをテストし検証するための堅牢な評価ツールセットが必要です。モザイクAIエージェント評価は、人間のフィードバック、グランドトゥルース、レスポンスやリクエストのログ、LLMジャッジのフィードバック、チェーントレースなどをキャプチャし、実装するためのプラットフォームを提供します。