Databricks での AI と機械学習

データ準備から本番運用モニタリングまでのAIライフサイクル全体を統合する統合プラットフォームである Mosaic AIを使用して、AIおよび機械学習アプリケーションを構築、デプロイ、管理します。

開始するための一連のチュートリアルについては、 AI と機械学習のチュートリアルを参照してください。

生成AI アプリケーションの構築

微調整されたLLM、AIエージェント、検索拡張生成など、エンタープライズグレードの生成AIアプリケーションを開発およびデプロイします。

- AI Playground
- ノーコードのプロンプトエンジニアリングとパラメータチューニングを用いた生成AIモデルのプロトタイピングとテスト。
- 基盤モデル
- ガバナンスとモニタリングの組み込みにより、安全でスケーラブルな APIs を通じて、最先端のLLMにサービスを提供します。
- エージェントフレームワーク
- RAGアプリケーションと Python 、任意のオーサリングライブラリを含む本番運用品質のエージェントを構築してデプロイします。
- 生成AI向けMLflow
- AIを活用したメトリクスと包括的なトレースオブザーバビリティを使用して、GenAIアプリケーションのライフサイクル全体で品質を測定、改善、監視します。
- Vector Search
- 埋め込みベクトルを保存し、クエリを実行し、RAGアプリケーションのナレッジベースに自動的に同期します。

自動化されたツールと共同開発環境を使用して機械学習モデルを作成します。

- AutoML
- 自動化された機能エンジニアリングとハイパーパラメーターチューニングを使用して、最小限のコードで高品質のモデルを自動的に構築します。
- Databricks機械学習ランタイム
- ディープラーニング開発のための TensorFlow、 PyTorch、 Keras、GPU サポートを備えた事前構成済みのクラスタリング。
- MLflowトラッキング
- エクスペリメントを追跡し、モデルのパフォーマンスを比較し、モデル開発ライフサイクル全体を管理します。
- 特徴量エンジニアリング
- 自動化されたデータパイプラインと機能検出を使用して、機能を作成、管理、提供します。
- Databricksノートブック
- MLワークフローにおける Python、R、Scala、SQL をサポートする共同開発環境。

組み込みのフレームワークを使用して、ディープラーニングモデルを開発します。

スケーラブルなエンドポイント、リアルタイム推論、エンタープライズグレードのモニタリングを使用して、モデルを本番運用にデプロイします。

モデルの品質、データの完全性、コンプライアンスを、包括的なモニタリングおよびガバナンスツールで確保します。

自動化されたワークフロー、 CI/CD 統合、本番運用に対応したパイプラインにより、機械学習の運用をスケールアップします。

- Unity Catalog上のモデル
- モデルレジストリ in Unity Catalog を使用して、一元化されたガバナンスと、デプロイを含むモデルのライフサイクルを管理します。
- Lakeflow ジョブ
- 自動化されたワークフローと本番運用に対応した ETL パイプラインを構築して、 ML データ処理を実現します。
- Ray on Databricks
- 分散コンピューティングを使用して ML ワークロードをスケーリングし、大規模なモデルのトレーニングと推論を実現します。
- MLOps ワークフロー
- 自動化されたトレーニング、テスト、デプロイのパイプラインを使用して、エンドツーエンドの MLOps を実装します。
- Git連携
- シームレスなGit統合と共同開発によるMLコードとノートブックのバージョン管理。