メインコンテンツまでスキップ

Databricks での機械学習

Databricks で機械学習アプリケーションを構築、デプロイ、管理する。統合プラットフォームは、データ準備から本番運用モニタリングまで、機械学習ライフサイクル全体を統合します。

生成AIやAIエージェントをお探しですか? DatabricksでAIエージェントを構築する方法については、こちらをご覧ください。

使い始める

クイックスタートを試す、データを準備する、またはローコードモデルを構築します。

従来の機械学習モデルをトレーニングする

自動化されたツールと共同開発環境を使用して機械学習モデルを作成します。

    • Databricks機械学習ランタイム
    • scikit-learn、XGBoost、MLflowなどの機械学習ライブラリ、およびディープラーニングフレームワークに対応した事前構成済みのクラスター。
    • MLflowトラッキング
    • エクスペリメントを追跡し、モデルのパフォーマンスを比較し、モデル開発ライフサイクル全体を管理します。

ディープラーニングモデルをトレーニングする

マネージド コンピュートと組み込みフレームワークを使用して、ディープラーニング モデルを開発できます。

    • 分散学習
    • Ray、 TorchDistributor、DeepSpeedを使用した分散型ディープラーニングの例。
    • AIランタイム
    • カスタムのディープラーニングのトレーニングおよび推論ワークロード向けのサーバレス GPU コンピュートです。
    • DLベストプラクティス
    • フレームワークの選択、データロード、分散スケーリング、そしてディープラーニングモデルのライフサイクル管理のためのガイダンス。
    • PyTorch
    • PyTorch を使用した単一ノードおよび分散トレーニング。

モデルのデプロイと提供

スケーラブルなエンドポイント、リアルタイム 推論、エンタープライズ グレードのモニタリングを使用して、モデルを本番運用にデプロイします。

    • モデルサービング
    • カスタムモデルとLLMを、自動スケーリングとGPUサポートを備えたスケーラブルなRESTエンドポイントとしてデプロイします。
    • AIゲートウェイ
    • 使用状況追跡、ペイロードロギング、およびセキュリティ制御を用いて、Databricksで提供されるモデルへのアクセスを管理および監視します。
    • 外部モデル
    • Databricks の外部でホストされているサードパーティモデルを、統一されたガバナンスとモニタリングと統合します。
    • 基盤モデルAPI
    • Databricks がホストする最先端のオープンモデルにアクセスしてクエリを実行します。

ML システムの監視と管理

モデルの品質、データの完全性、コンプライアンスを、包括的なモニタリングおよびガバナンスツールで確保します。

    • Unity Catalog
    • データ、機能、モデル、機能を、統合されたアクセス制御、リネージ追跡、ディスカバリーで管理します。
    • データプロファイリング
    • データ品質、モデルのパフォーマンス、予測ドリフトを、自動アラートと根本原因分析で監視します。
    • 異常検出
    • カタログ レベルでデータの鮮度と完全性を監視します。
    • モデルの MLflow
    • エクスペリメントを追跡し、Unity Catalog でモデルを管理し、開発ライフサイクル全体で機械学習モデルをデプロイおよび評価します。

ML ワークフローの本番環境化

自動化されたワークフロー、 CI/CD 統合、本番運用に対応したパイプラインにより、機械学習の運用をスケールアップします。

    • Unity Catalog上のモデル
    • モデルレジストリ in Unity Catalog を使用して、一元化されたガバナンスと、デプロイを含むモデルのライフサイクルを管理します。
    • Lakeflow ジョブ
    • 自動化されたワークフローと本番運用に対応した ETL パイプラインを構築して、 ML データ処理を実現します。
    • Ray on Databricks
    • 分散コンピューティングを使用して ML ワークロードをスケーリングし、大規模なモデルのトレーニングと推論を実現します。
    • MLOps ワークフロー
    • 自動化されたトレーニング、テスト、デプロイのパイプラインを使用して、エンドツーエンドの MLOps を実装します。