モデルサービングエンドポイント向けのサーバーレス最適化デプロイメント

この記事では、モデルサービングエンドポイントでサーバーレスに最適化されたデプロイメントを使用する方法について説明します。サーバーレスで最適化されたデプロイメントにより、デプロイメント時間が大幅に短縮され、モデルサービング環境がモデルトレーニング環境と同じに保たれます。

サーバーレスに最適化されたデプロイメントとは何ですか?

サーバレスに最適化されたデプロイメントでは、モデルの登録中にサーバレスノートブック環境でのパッケージ化とステージングモデルのアーティファクトが利用され、その結果、エンドポイントのデプロイメントが加速され、トレーニングとサービングの間で一貫した環境が実現します。

これは、モデルのアーティファクトと環境がデプロイメント時にコンテナーにパッケージ化される、非サーバーレス最適化デプロイメントとは異なります。このような場合、サービング環境はモデルのトレーニング中に使用された環境と一致しない可能性があります。

要件

サーバレス最適化エンドポイントには、モデルサービングエンドポイントと同じ要件があります ( 「要件」を参照)。加えて：

モデルはカスタムモデルである必要があります（ FMAPIではありません）
モデルはバージョン 3 または 4 を使用してサーバレスノートブックに記録および登録する必要があります
モデルはログインして登録する必要があります mlflow>=3.1
モデルはUCに登録され、CPUで提供される必要があります
モデルの最大環境サイズは1GBです

サーバーレス最適化デプロイメントの使用

モデルのロギングや登録をする場合は、クライアント 3 または 4 とmlflow>=3.1でサーバレスノートブックを使用します。

サーバーレス環境のクライアントバージョンを調整するには、「サーバーレス環境の構成」を参照してください。

次に、モデルを登録するときに、 env_packに希望の値を設定します。

Python
import mlflow
from mlflow.utils.env_pack import EnvPackConfig

mlflow.register_model(
    model_info.model_uri,
    model_name,
    env_pack=EnvPackConfig(name="databricks_model_serving")
)

env_pack問題を追加すると、関数パックが作成され、モデルの登録中にモデルのアーティファクトとサーバレスノートブック環境がステージングされ、デプロイメント中に使用できるように準備されます。これには、 env_packを使用せずにモデルを登録する場合と比べて追加の時間がかかる可能性があります。

EnvPackConfig 環境が有効であることを確認するために、モデルの依存関係が現在の環境にインストールされているかどうかを判別するパラメーターinstall_dependencies (デフォルトではTrue ) があります。そのステップをスキップしたい場合は、値をFalseに設定します。

注記

install_dependenciesがTrueに設定されている場合、インターネットにアクセスできないワークスペース内のエンドポイント、またはカスタムライブラリに依存するエンドポイントは失敗する可能性があります。このような場合は、 install_dependenciesをFalseに設定します。

省略形としてEnvPackConfig(...) "databricks_model_serving"に置き換えることもできます。これはEnvPackConfig(name="databricks_model_serving", install_dependencies = True)と同等です。

モデルの登録が完了したら、モデルサービングにモデルをデプロイすることができます。デプロイメント時間が短縮され、イベントログにコンテナーのビルドが示されなくなったことに注意してください。

サーバーレスに最適化されたデプロイメントとは何ですか?​

要件​

サーバーレス最適化デプロイメントの使用​

サーバーレスに最適化されたデプロイメントとは何ですか?

要件

サーバーレス最適化デプロイメントの使用