コンセプト: DatabricksでのAIの生成

GenAI アプリは、生成AIモデル (大規模言語モデル、画像生成モデル、テキスト読み上げモデルなど) を使用して、新しい出力を作成したり、複雑なタスクを自動化したり、ユーザー入力に基づいてインテリジェントな対話を行ったりするアプリケーションです。

GenAI アプリは、LLM や他の GenAI モデルへの単純な呼び出し、または複雑な AI エージェントによって駆動できます。複雑さのレベルの詳細については、こちらをご覧ください。

GenAI アプリのエージェント、ツール、評価、モデルなどの側面は、独自のデータを使用してカスタマイズできます。このデータドリブンのカスタマイズはデータインテリジェンスにつながり、既成のAIモデルが提供する一般的なインテリジェンスを超えることができます。

GenAIアプリケーション

ユーザー向けの GenAI アプリケーションには、次のようなさまざまな形式があります。

Databricks Appsを使用してデプロイされたチャットアプリなど
モデルサービングにデプロイされたエージェントなどのAPIエンドポイント
AI関数などのアナリスト向けのSQL関数

GenAI アプリケーションを成功させるには、多くの場合、アプリケーション開発と AI 評価という 2 つのスキルセットが必要です。GenAI アプリの開発は、非 AI アプリケーションの開発とよく似ており、アプリケーションの種類に応じたソフトウェアスキルが必要です。ただし、GenAI アプリケーションの評価には、GenAI の複雑さとオープンエンドの応答を処理するための特殊なツールとテクニックが必要です。

Databricks 上で業界固有の GenAI アプリを構築する方法については、以下を参照してください。

ユースケース、顧客、その他のリソースについては、Databricks の業界向けソリューションをご覧ください。
Databricks ソリューションアクセラレータは、実行および変更できるユースケース実装の例です。

GenAI評価

GenAI モデル、エージェント、アプリケーションは、多くの場合、複雑でオープンエンドの動作をします。ユーザーは任意のクエリを入力できます。AI エージェントは実行中にテキストや画像などを収集できるようになります。出力は任意のテキスト、画像、またはその他のメディアにすることができ、多くの「適切な」回答が得られる可能性があります。

これらの複雑さにより、GenAI の評価は困難になります。適切な評価には以下が必要です。

AIを評価するためのAIを使った自動化
専門家やユーザーからの人間によるフィードバックにより、グラウンドトゥルースを収集し、自動評価を調整します。
複雑なエージェントを深く掘り下げて動作を理解しデバッグする

Databricks が管理する MLflow と関連ツールは、GenAI 評価の基盤を提供します。

AIエージェントの評価と監視- 評価、本番運用モニタリング、人間によるフィードバックについて学びます。
開始: GenAI 向け MLflow 3 - トレース、評価、および人間からのフィードバックの収集を試します。
MLflow Tracing - GenAI の可観測性- エージェントの動作を記録および分析するためのMLflow Tracingについて学習します。

エージェント

エージェントまたはエージェントシステムとは 、環境を自律的に認識、決定し、行動して目標を達成できる AI 駆動型システム です。プロンプトが表示されたときにのみ出力を生成するスタンドアロンの GenAI モデルとは異なり、エージェントシステムはある程度の エージェンシー を備えています。最新の AI エージェントは、次のようなシステムの「頭脳」として GenAI モデルを使用します。

別のエージェントからのユーザーリクエストまたはメッセージを受信します。
どのように進めるかについての理由: どのデータを取得するか、どのロジックを適用するか、どのツールを呼び出すか、またはユーザーにさらに入力を要求するかどうか。
計画を実行し、複数のツールを呼び出したり、サブエージェントに委任したりすることも可能です。
回答を返すか、ユーザーに追加の説明を求めます。

一般的なインテリジェンス (GenAI モデルの事前トレーニング済み機能) とデータインテリジェンス(ビジネスに固有の専門知識とAPIs ) を橋渡しすることで、エージェントシステムは、高度な顧客サービスフロー、データ豊富な分析ボット、複雑な運用タスクのためのマルチエージェントオーケストレーションなど、影響力の高いエンタープライズユースケースを可能にします。

シンプルな GenAI モデルから複雑なエージェントまで連続性があります。詳細については、「エージェントシステムの設計パターン」を参照してください。

Databricks は、完全なガイド付きから完全なカスタムまで、エージェントを構築するためのさまざまなオプションを提供します。

Agent Bricks は、ナレッジアシスタントや情報抽出などの主要なアプリケーション向けのガイド付きエージェントビルダーを提供します。
AI Playground は、ツール呼び出しエージェントのプロトタイプ作成用の UI を提供し、そこから生成されたエージェントコードをエクスポートできます。
カスタムエージェントを使用すると、カスタムコードまたはサードパーティのエージェント作成ライブラリを使用してエージェントを構築および展開できます。

ツール

AI エージェントはツールを呼び出して情報を収集したりアクションを実行したりできます。ツールは、LLM が明確に定義されたタスクを実行するために呼び出すことができる単一の対話関数です。AIモデルは通常、ツール呼び出しごとに struct を生成し、ツールは簡単な入出力対話を提供します。

一般的なツールのカテゴリは次のとおりです。

データを取得または分析するツール
- セマンティック検索 : ベクトルインデックスをクエリして、関連するテキストやその他の非構造化データを検索します。
- 構造化取得 : 実行SQLクエリまたはAPIsを使用して構造化情報を取得します。
- Web 検索ツール : インターネットまたは社内の Web コーパスを検索します。
- クラシック ML モデル : 機械学習モデルを呼び出して、分類、回帰、その他の予測を実行します。
- GenAI モデル : コードや画像などの特殊な出力を生成します。
外部システムの状態を変更するツール
- API 呼び出し : CRM エンドポイント、内部サービス、またはその他のサードパーティ統合を呼び出します。
- Eメールまたはメッセージングアプリの統合 : メッセージを投稿したり、通知を送信したりします。
ロジックを実行したり特定のタスクを実行したりするツール
- コード実行 : ユーザーが提供したコードまたは LLM によって生成されたコードをサンドボックスで実行します。

ツールはエージェントロジックに組み込むことも、 MCPなどの標準化されたインターフェイスを使用してアクセスすることもできます。

ツールとエージェント:

ツールは、明確に定義された単一の操作を実行します。エージェントはよりオープンエンドなタスクを実行できます。
ツールは一般にステートレスであり、各呼び出しを超えて進行中のコンテキストを維持しません。エージェントはタスクを反復的に解決しながら状態を維持します。

ツールのエラー処理と安全性:

各ツール呼び出しは API 呼び出しなどの外部操作であるため、システムは障害を適切に処理する必要があります。タイムアウト、不正な応答、または無効な入力によって、エージェント自体が完全に失敗するようなことはあってはなりません。本番運用では、許可されるツール呼び出しの数を制限し、ツール呼び出しが失敗した場合はフォールバック応答を用意し、エージェントシステムが同じ失敗したアクションを繰り返し試行しないようにガードレールを適用します。

Databricks の AI ツールの詳細については、以下をご覧ください。

AIエージェントツール- ツールアプローチガイド
Databricks 上のモデルコンテキストプロトコル (MCP) - マネージド、カスタム、および外部 MCP サーバー

GenAIモデルとLLM

大規模言語モデル (LLM) は、人間の言語を理解、生成、推論できる大規模なテキストデータセットでトレーニングされた AI モデルです。LLM は、入力プロンプトに基づいてコンテキストに関連するテキストを予測および生成することで、チャットボット、コードアシスタント、コンテンツ生成ツールなどのアプリケーションを強化します。

より一般的には、GenAI モデルまたは基盤モデルは、テキスト以外のモードについて学習するために、大量のテキスト、画像、ビデオ、オーディオ、またはその他のデータでトレーニングされます。マルチモーダルモデルは、人間の言語を画像、音声、その他のメディアと結び付けることを学習します。LLM は GenAI または基盤モデルの一種ですが、これらの用語は多くの場合、あいまいに、互換的に使用されます。

GenAI モデルは、GenAI エージェントとアプリの背後にあるインテリジェンスを提供します。シンプルなアプリは、多くの場合、プロンプトエンジニアリングでカスタマイズされた単一のモデルを使用して構築されます。

Databricks での GenAI モデルの使用について学習します。

迅速なエンジニアリング

GenAI モデルは通常、プロンプト、つまりユーザー入力の処理方法をモデルに指示する指示を受け取ります。プロンプトは、詳細なステップ、専門知識、データ、その他の情報を使用して大幅にカスタマイズできます。

Databricks は、迅速なエンジニアリングを行うための柔軟な方法を提供します。例えば：

Agent Bricks は、データとフィードバックに基づいて、内部で迅速なエンジニアリングを自動化します。
AI Playground は、手動のインタラクティブなプロンプトエンジニアリング用の UI を提供します。
MLflowプロンプト最適化とDSPy 、データドリブンプロンプト最適化ルーチンを提供します。

ファインチューニングモデル

GenAI モデルは、カスタムデータを使用して特定のドメインまたはアプリケーション用のモデルをカスタマイズするファインチューニングを通じてカスタマイズすることもできます。

Databricks は、モデルを微調整するための柔軟な方法を提供します。例えば：

Agent Bricks はデータドリブンのカスタマイズを自動化し、内部で微調整を行う可能性があります。
サーバーレス GPU コンピュートは、完全にカスタマイズ可能なファインチューニングのためのコンピュートインフラストラクチャを提供します。例を参照してください。

GenAI プラットフォームとは何ですか?

GenAI には、データと AI を組み合わせたプラットフォームが必要です。開発者と管理者の両方にとって、GenAI の主要コンポーネントは、シンプルで統合されたプラットフォームで接続され、管理される必要があります。

主なコンポーネントは次のとおりです。

モデル、エージェント、アプリなどのAI資産
ファイル、テーブル、処理パイプライン、ベクトルインデックス、フィーチャーストアなどのデータ資産
モデルやエージェントのエンドポイントなどのAIデプロイメント
AIとデータ資産の構築と展開のためのツール

主なガバナンス機能は次のとおりです。

AI とデータ資産の統合ガバナンス。詳細については、「Unity Catalog とは何ですか?」をご覧ください。
GenAI モデルエンドポイントの統合ガバナンス。詳細については、 AI Gatewayをご覧ください。
統一されたセキュリティアプローチ。詳細については、 Databricks AI セキュリティをご覧ください。
AI とデータツールの統合管理。詳細については、「管理」を参照してください。

また、 Databricks生成AI機能」とDatabricksアーキテクチャ」も参照してください。

一般的な知能とデータ知能

一般的なインテリジェンスとデータインテリジェンスを比較した図。

汎用知能 とは、多様なテキストに対する広範な事前トレーニングから LLM が本質的に知っていることを指します。これは言語の流暢さと一般的な推論に役立ちます。
データインテリジェンスとは、組織のドメイン固有のデータとAPIs指します。これには、顧客記録、製品情報、ナレッジベース、独自のビジネス環境を反映するドキュメントなどが含まれる場合があります。

エージェントシステムはLLMこれら 2 つの知識ソースを融合します。LLM の広範で一般的な知識から始まり、次に、お金またはドメイン固有のデータを取り込んで、詳細な質問に答えたり、特殊なアクションを実行したりします。 Databricks を使用すると、あらゆるレベルで GenAI アプリにデータインテリジェンスを埋め込むことができます。

ベクトルインデックスやGenieなどのデータソース
エージェント（カスタムエージェント設計とAgent Bricksからの自動設計の両方を含む）
評価データとメトリクス
評価データに基づく迅速な最適化
モデルのファインチューニング (カスタムファインチューニングとAgent Bricksによる自動チューニングの両方を含む)

GenAI vs. ML vs. ディープラーニング

生成型人工知能 (GenAI)、機械学習 (ML)、ディープラーニング (DL) 間の境界は曖昧になることがあります。このガイドは GenAI に焦点を当てていますが、次のDatabricksプラットフォーム機能はML 、ディープラーニング、および GenAI をサポートしています。

モデルサービングは、ML、ディープラーニング、GenAI モデルをサポートします。これをGenAI バッチ推論に使用したり、カスタムモデルサービングを使用してエージェントや微調整されたモデルを展開したりするために使用できます。
サーバーレス GPU コンピュートと機械学習用の GPU 対応Databricks Runtime使用して、 ML 、ディープラーニング、および GenAI モデルをトレーニングしたり微調整したりできます。
MLflowエクスペリメント追跡は、クラシックMLと GenAI エクスペリメントおよび実行の両方を追跡するために使用できます。
Databricks Feature Store は、従来の ML と GenAI の両方の構造化データを管理および提供するために使用できます。

もっと詳しく知る

GenAI アプリ構築における主な課題- GenAI の主な課題とDatabricksを使用したそれらの解決策
エージェントシステムの設計パターン- シンプルなものから複雑なものまで、GenAI エージェントと実践的なアドバイス
Databricks 上の AI - Databricks 上の AI のユースケース、顧客、その他のリソース

GenAIアプリケーション​

GenAI評価​

エージェント​

ツール​

GenAIモデルとLLM​

迅速なエンジニアリング​

ファインチューニングモデル​

GenAI プラットフォームとは何ですか?​

一般的な知能とデータ知能​

GenAI vs. ML vs. ディープラーニング​

もっと詳しく知る​