メインコンテンツまでスキップ

TensorFlow と TensorRT を使用したモデル推論

この記事のノートブックの例は、TensorFlow と TensorFlowRT を使用した Databricks の推奨 ディープラーニング推論ワークフロー を示しています。 この例では、学習済みの ResNet-50 モデルを TensorRT で最適化してモデル推論を行う方法を示します。

NVIDIA TensorRT は、ディープラーニング推論アプリケーション向けの低遅延と高スループットを実現する高性能推論オプティマイザーおよびランタイムです。 TensorRT は、 GPU 対応 バージョンの Databricks Runtime for Machine Learning にインストールされます。

Databricks 、機械学習モデルを本番運用にデプロイするために最適化された G4 インスタンスタイプシリーズを使用することをお勧めします。

モデル推論 TensorFlow-TensorRT ノートブック

Open notebook in new tab