メインコンテンツまでスキップ

Mosaic AIによる機械学習

Mosaic AI は、データの収集と準備から、モデル開発とLLMOps、提供とモニタリングまで、 AI ライフサイクルを統合します。 Mosaic AIを使用すると、単一のプラットフォームでMLの開発とデプロイのすべてのステップに対応できます。data scientists、データエンジニア、 ML エンジニア、および DevOps は、データの同じツールセットと単一の真実のソースを使用して、それぞれの仕事をすることができます。

この記事では、人工知能 (AI) および機械学習 (ML) システムの構築を支援するために SAP Databricks が提供するツールについて説明します。

特徴量

SAP Databricks には、次の AI 機能と ML 機能が含まれています。

  • Databricksワークスペースから生成AI モデルをテストするためのAI Playground。プロンプトを表示、比較、およびシステムプロンプトや推論パラメーターなどの設定を調整できます。
  • AI Functions は、テキスト翻訳や感情分析などのAIを Databricksに保存されているデータに適用するために使用できます。
  • サポートされている生成AIモデルと、それに関連するモデルサービングエンドポイントの管理およびアクセス監視のためのMosaic AI Gateway
  • LLM のデプロイのためのMosaic AI Model Serving
  • Mosaic AI Vector Search は、埋め込みベクトルを保存するクエリ可能なベクトルデータベースを提供し、ナレッジベースに自動的に同期するように設定できます。
  • レイクハウスモニタリング for data monitoring and tracking model prediction quality and drift using automatic payload logging with inference tables.
  • AI エージェントと ML モデルのライフサイクルのためのマネージド MLflow
  • Retrieval Augmented Generation (RAG) アプリケーションのような本番運用品質のエージェントを構築およびデプロイするためのMosaic AI エージェントフレームワーク 。
  • Mosaic AI Agent Evaluationは、RAGアプリケーションやチェーンを含む生成AIアプリケーションの品質、コスト、レイテンシを評価します。
  • AutoML は、データセットに機械学習を適用するプロセスを簡素化します。
  • 基盤モデル ファインチューニング 独自のデータを使用して基盤モデルをカスタマイズし、特定のアプリケーションに対してそのパフォーマンスを最適化します。
  • Unity CatalogAIモデルやエクスペリメントなどの 資産を管理するための 。

Unity Catalog で AI アセットを管理する

Mosaic AIは、データレイヤーとMLプラットフォームを統合します。 すべてのデータ資産とアーティファクト (モデルや関数など) は、1 つのカタログで検出および管理できます。 データとモデルを一元管理することで、生データから本番運用モデルまでのリネージの追跡が可能になります。 組み込みのデータとモデルのモニタリング は、プラットフォームにも保存されるテーブルに品質メトリクスを保存するため、モデルのパフォーマンス問題の根本原因を簡単に特定できます。

LLMとチャットし、AI Playgroundを使用して生成AIアプリをプロトタイプ化

AI Playgroundを使用して、サポートされている大規模言語モデルと対話できます。AI Playgroundは、LLMをテストしたり、促したり、比較したりできるチャットのような環境です。LLM とのチャットおよびAI Playgroundを使用した生成AI アプリのプロトタイピング を参照してください。

AI Functionsで を使用するSQL

には、 に保存されているデータにテキスト翻訳や感情分析などのAI Functions を適用するために使用できる組み込み関数があります。AIDatabricksこれらは、ノートブックと SQL エディターから実行できます。アナリスト、 data scientists、機械学習エンジニアは、 AI 機能を使用して、独自のデータにデータインテリジェンスを適用できます。 SAP を使用したデータへの の適用AIDatabricksAI Functions を参照してください。

AIゲートウェイ

Mosaic AI Gateway は、組織内の生成AI モデルとエージェントの使用と管理を効率化するように設計されています。 これは、ガバナンス、モニタリング、および本番運用の準備をモデルサービングエンドポイントにもたらす一元化されたサービスです。 また、AI トラフィックを実行、保護、管理して、組織の AI 導入を民主化し、加速することもできます。モデルサービングエンドポイントでの AI Gateway の設定を参照してください。

Mosaic AI Model Serving を使用したモデルのデプロイ

Mosaic AI Model Serving は、リアルタイムおよびバッチ推論のための AI モデルをデプロイ、制御、クエリするための統一されたインターフェイスを提供します。提供する各モデルは、Web アプリケーションまたはクライアント アプリケーションに統合できる REST API として使用できます。

モデルサービングエンドポイントは、生成AI モデルにアクセスするために特別に設定できます。

  • 基盤モデルを用いた最先端のオープンLLM API.
  • Databricks の外部でホストされているサードパーティモデル。

Mosaic AI Vector Searchは、Databricks Data Intelligence Platformに組み込まれ、そのガバナンスおよび生産性ツールと統合されているベクトル検索ソリューションです。Mosaic AI Vector Searchは、埋め込みベクトルを保存するクエリ可能なベクトルデータベースを提供し、ナレッジベースに自動的に同期するように設定できます。エンベッディングは、RAG(Retrieval Augmented Generation)、レコメンデーションシステム、画像認識など、類似性検索を必要とするアプリケーションにとって非常に重要です。

レイクハウス モニタリング

Databricks レイクハウスモニタリングでは、アカウント内のすべてのテーブルのデータの統計プロパティと品質を監視できます。また、これを使用して、モデル入力と予測を含む推論テーブルを監視することにより、機械学習モデルとモデルサービングエンドポイントのパフォーマンスを追跡することもできます。 レイクハウスモニタリングによるデータとAI資産のモニターを参照してください。

マネージド MLflow

SAP Databricks には、MLflow 2.0 のマネージド バージョンが用意されています。MLflow は、モデルを開発し、アプリケーションを生成するためのオープンソース プラットフォームAI 。 これには、次の主要コンポーネントがあります。

  • トラッキング:エクスペリメントを追跡して、パラメーターと結果を記録および比較できます。
  • モデル: さまざまな ML ライブラリからさまざまなモデルサービングおよび推論プラットフォームにモデルを管理およびデプロイできます。
  • モデルレジストリ: モデルのバージョン管理とアノテーション機能を使用して、ステージングから本番運用までのモデルデプロイプロセスを管理できます。
  • AI エージェントの評価と トレース: エージェントの比較、評価、トラブルシューティングを支援することで、高品質の AI エージェントを開発できます。

Mosaic AIエージェントフレームワーク

Mosaic AI Agent Framework は、開発者が Retrieval Augmented Generation (RAG) アプリケーションのような本番運用品質のエージェントを構築、デプロイ、評価できるように設計された Databricks 上の一連のツールで構成されています。

LangChainやLlamaIndexなどのサードパーティフレームワークと互換性があるため、好みのフレームワークで開発でき、Databricks管理Unity Catalog、エージェント評価フレームワーク、およびその他のプラットフォームの利点を活用しながら開発できます。

Mosaic AIエージェントの評価

Mosaic AI Agent Evaluationは、開発者がRAGアプリケーションやチェーンを含むエージェントAIアプリケーションの品質、コスト、レイテンシを評価するのに役立ちます。エージェント評価は、品質の問題を特定し、それらの問題の根本原因を特定するように設計されています。Agent Evaluation の機能は、 MLOps ライフサイクルの開発フェーズ、ステージングフェーズ、本番運用フェーズ全体で統合されており、すべての評価メトリクスとデータは MLflow 実行に記録されます。

AutoML 予測

AutoML 予測は、フルマネージド コンピュート リソースで実行しながら、最適なアルゴリズムとハイパーパラメータを自動的に選択することで、時系列データの予測を簡素化します。 予測エクスペリメントを実行するには、「 AutoML 予測」を参照してください。

基盤モデル ファインチューニング

注記

この製品を使用するには、ワークスペースがサポートされているリージョン us-east-1にある必要があります。

基盤モデル ファインチューニングを使用すると、独自のデータを使用して基盤モデルをカスタマイズし、特定のアプリケーションに合わせてパフォーマンスを最適化できます。 基盤モデルのファインチューニングや継続的なトレーニングを行うことで、モデルを一からトレーニングするよりも大幅に少ないデータ、時間、コンピュートリソースで自分のモデルをトレーニングすることができます。

詳細情報

Databricks の機械学習と人工知能機能の詳細については、 AWS のドキュメントで Databricks の AI と機械学習に関する完全なドキュメントを参照してください。注: SAP Databricks でサポートされている機能のセットは、AWS の Databricks とは異なります。