メインコンテンツまでスキップ

AI モデルと ML モデルのトレーニング

Databricks 、マネージド クラスター ランタイムから完全なサーバーレス GPU 環境に至るまで、さまざまな機械学習のニーズに合わせた柔軟なコンピュート ソリューションを提供します。

    • サーバレスGPUコンピュート
    • カスタムのシングルノードおよびマルチノードのディープラーニング ワークロード向けに最適化されたサーバーレス GPU コンピュート環境。
    • Databricks機械学習ランタイム
    • 従来の機械学習およびディープラーニングのワークロード向けに事前構築されたライブラリを備えたクラシックなコンピュート環境。

サーバレスGPUコンピュート(ベータ版)

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。「Databricks プレビューの管理」を参照してください。

サーバーレス GPU コンピュートは、 Databricksサーバーレス エコシステム内の特殊な製品です。 ファインチューニング LLM やコンピュータ ビジョン モデルのトレーニングなど、カスタムのシングルノードおよびマルチノードのディープラーニング ワークロード向けに最適化されています。

主な機能は次のとおりです。

  • 即時可用性 : 基盤となるクラスター インフラストラクチャを管理する必要がなくなり、ノートブックをサーバレス GPU リソースに直接接続できるようになります。
  • 高性能ハードウェア : コスト効率の高いタスクには A10 GPU へのアクセスを提供し、大規模な AI ワークロードには H100 GPU へのアクセスを提供します。
  • 管理対象環境 : 完全なカスタマイズが可能なデフォルトのベース環境、または Transformers や Ray などの一般的な ML パッケージがプリロードされた AI 環境を提供します。
  • 柔軟なスケーリング : 複数の GPU とノードにわたる分散トレーニングをサポートします。

Databricks機械学習ランタイム

Databricks Runtime for Machine Learningは、事前構築されたインフラストラクチャを使用してコンピュート リソースの作成を自動化する特殊なランタイムです。 これは、従来の機械学習とディープラーニングの両方に対応した、すぐに使用できる包括的な環境を求めるユーザー向けに設計されています。

主な機能は次のとおりです。

  • プリインストールされたライブラリ : PyTorch、TensorFlow、XGBoost などの人気のライブラリが含まれており、頻繁に更新され、最適化されたサポートが提供されます。
  • コンピュートの多用途性 : 価格対パフォーマンスを向上させるAWS Gravitonを含む、CPU ベースと GPU ベースの両方のインスタンス タイプをサポートします。
  • 最適化 : Photon との統合により、Spark SQL、DataFrames、機能エンジニアリング タスクを高速化します。
  • アクセス制御 : Unity Catalog を介した安全なデータ アクセスには専用のアクセス モードが必要です。