AI モデルと ML モデルのトレーニング

Databricks 、マネージドクラスターランタイムから完全なサーバーレス GPU 環境に至るまで、さまざまな機械学習のニーズに合わせた柔軟なコンピュートソリューションを提供します。

- AIランタイム
- カスタムのシングルノードおよびマルチノードのディープラーニングワークロード向けに最適化されたサーバーレス GPU コンピュート環境。
- Databricks機械学習ランタイム
- 従来の機械学習およびディープラーニングのワークロード向けに事前構築されたライブラリを備えたクラシックなコンピュート環境。

AI Runtime （プレビュー版）

備考

プレビュー

AI Runtimeは、 Databricksのエコシステム内における専門的なサービスです。ファインチューニング LLM やコンピュータビジョンモデルのトレーニングなど、カスタムのシングルノードおよびマルチノードのディープラーニングワークロード向けに最適化されています。サーバレスコンピュートがDatabricksアーキテクチャにどのように適合するかの概要については、「サーバレスワークスペースアーキテクチャ」を参照してください。

主な機能は次のとおりです。

即時可用性 : 基盤となるクラスターインフラストラクチャを管理する必要がなくなり、ノートブックをサーバレス GPU リソースに直接接続できるようになります。
高性能ハードウェア : コスト効率の高いタスクには A10 GPU へのアクセスを提供し、大規模な AI ワークロードには H100 GPU へのアクセスを提供します。
管理対象環境 : 完全なカスタマイズが可能なデフォルトのベース環境、または Transformers や Ray などの一般的な ML パッケージがプリロードされた AI 環境を提供します。
柔軟なスケーリング : 複数の GPU とノードにわたる分散トレーニングをサポートします。

Databricks機械学習ランタイム

Databricks Runtime for Machine Learningは、事前構築されたインフラストラクチャを使用してコンピュートリソースの作成を自動化する特殊なランタイムです。これは、従来の機械学習とディープラーニングの両方に対応した、すぐに使用できる包括的な環境を求めるユーザー向けに設計されています。

主な機能は次のとおりです。

プリインストールされたライブラリ : PyTorch、TensorFlow、XGBoost などの人気のライブラリが含まれており、頻繁に更新され、最適化されたサポートが提供されます。
コンピュートの多用途性 : 価格対パフォーマンスを向上させるAWS Gravitonを含む、CPU ベースと GPU ベースの両方のインスタンスタイプをサポートします。
最適化 : Photon との統合により、Spark SQL、DataFrames、機能エンジニアリングタスクを高速化します。
アクセス制御 : Unity Catalog を介した安全なデータアクセスには専用のアクセスモードが必要です。

AI Runtime （プレビュー版）​

Databricks機械学習ランタイム​

AI Runtime （プレビュー版）

Databricks機械学習ランタイム