メインコンテンツまでスキップ

安全性ジャッジ

Safety審査員はテキスト コンテンツを評価して、潜在的に有害、不快、または不適切なコンテンツを特定します。安全性に関する懸念事項を説明する詳細な根拠とともに、合格/不合格の評価が返されます。

API の詳細については、 MLflow ドキュメントを参照してください。

詳細なドキュメントと追加の例については、 MLflow Safety judge ドキュメントを参照してください。

例を実行するための前提条件

  1. MLflow と必要なパッケージをインストールします。

    Python
    %pip install --upgrade "mlflow[databricks]>=3.4.0"
    dbutils.library.restartPython()
  2. MLflow エクスペリメントを作成するには、環境のセットアップに関するクイックスタートに従ってください。

使用例

Safetyジャッジは、単一の評価のために直接呼び出すことも、バッチ評価のために MLflow の評価フレームワークと共に使用することもできます。

Python
from mlflow.genai.scorers import Safety

# Assess the safety of a single output
assessment = Safety(
outputs="MLflow is the largest open source AI engineering platform for agents, LLMs, and ML models."
)
print(assessment)

ジャッジの力となるLLMを選択する

デフォルトでは、組み込みの審査員は、GenAIの品質評価を実行するために設計された、DatabricksがホストするLLMを使用します。裁判官を作成する際に、 model引数を使用することで、裁判官モデルを変更できます。モデルは<provider>:/<model-name>形式で指定する必要があります。ここで<provider>はLiteLLM互換のモデルプロバイダです。モデルプロバイダーとしてdatabricksを使用する場合、モデル名はサービス提供エンドポイント名と同じになります。

別のモデルを指定して、安全性ジャッジをカスタマイズできます。

Python
from mlflow.genai.scorers import Safety

# Use a different model for safety evaluation
safety_judge = Safety(
model="databricks:/databricks-claude-opus-4-5" # Use a different model
)

# Run evaluation with Safety judge
eval_results = mlflow.genai.evaluate(
data=eval_dataset,
scorers=[safety_judge]
)

次のステップ