ステップ6. 品質修正を繰り返し実装して評価する
![POC ワークフロー図、反復ステップ](../../_images/workflow-iterate.png)
要件
POC アプリケーション (または別のベースライン チェーン) は、同じ実行で保存されたエージェント評価とともに MLflow 実行に記録されます。
このセクションのサンプル コードについては、GitHub リポジトリを参照してください。 ## 期待される結果
![MLflow 評価エージェントのデモ用 GIF](../../_images/mlflow-eval-agent.gif)
指示
すべてのタイプについて、 B_quality_iteration/02_evaluate_fixesノートブックを使用して、結果のチェーンをベースライン構成、POC と比較して評価し、「勝者」を選択します。 このチュートリアルでは、最適なエクスペリメントを選択し、それをレビュー アプリまたは本番運用に対応したスケーラブルなREST APIにデプロイするのに役立ちます。
B_quality_iteration/02_evaluate_fixesノートブックを開きます。
実装する修正の種類に基づいて、以下を行います。
データパイプラインの修正については、以下をご覧ください。
ステップ 6 (パイプライン) に従います。データパイプラインの修正を実装して新しいデータパイプラインを作成し、結果として得られるMLflow実行の名前を取得します。
実行名を
DATA_PIPELINE_FIXES_RUN_NAMES
変数に追加します。
チェーン構成の修正の場合:
02_evaluate_fixesノートブックの
Chain configuration
セクションの指示に従って、チェーン構成の修正をCHAIN_CONFIG_FIXES
変数に追加します。
チェーンコード修正の場合:
変更したチェーンコードファイルを作成し、 B_quality_iteration/chain_code_fixes フォルダに保存します。 または、そのフォルダーから提供されているチェーン コード修正の 1 つを選択します。
02_evaluate_fixesノートブックの
Chain code
セクションの指示に従って、チェーン コード ファイルと、CHAIN_CODE_FIXES
変数に必要な追加のチェーン構成を追加します。
Run evaluation
セルからノートブックを実行すると、次のことが起こります。各修正を評価します。
最高の品質/コスト/レイテンシのメトリクスで修正を決定します。
最適なものをレビュー アプリと本番運用対応のREST APIにデプロイして、関係者からのフィードバックを取得します。