クイック スタート: 開発環境を MLflow に接続する
このページでは、 MLflow エクスペリメントを作成し、開発環境をそれに接続する方法について説明します。
MLflowエクスペリメントは、生成AIアプリケーションのコンテナです。エクスペリメントの詳細についてはMLflowエクスペリメント データ モデル コンセプト ガイドを参照してください。
開発環境に関連するセクションに移動します。
ローカル開発環境
手順 1: MLflow をインストールする
Databricks 接続を使用して MLflow をインストールします。
pip install --upgrade "mlflow[databricks]>=3.1"
ステップ 2: MLflow エクスペリメントを作成する
- Databricks ワークスペースを開きます。
- 左側のサイドバーの AI/ML で、 エクスペリメント をクリックします。
- エクスペリメント ページの上部にある GenAIアプリとエージェント をクリックします。
ステップ 3: 認証を構成する
次の手順では、Databricks パーソナル アクセス トークンの使用について説明します。MLflow は、 Databricks でサポートされている他の認証方法とも連携します。
次のいずれかの認証方法を選択します。
- Environment Variables
- .env File
- MLflowエクスペリメントで、[ Generate API Key ] をクリックします。
- 生成されたコードをターミナルにコピーして実行します。
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_EXPERIMENT_ID=<experiment-id>
- MLflowエクスペリメントで、[ Generate API Key ] をクリックします。
- 生成されたコードをプロジェクト ルートの
.env
ファイルにコピーします。
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_EXPERIMENT_ID=<experiment-id>
python-dotenv
パッケージをインストールします。
pip install python-dotenv
- コードに環境変数を読み込みます。
# At the beginning of your Python script
from dotenv import load_dotenv
# Load environment variables from .env file
load_dotenv()
ステップ 4: 接続を確認する
テスト ファイルを作成し、次のコードを実行して接続を確認し、テスト トレース を MLflow エクスペリメントに記録します。
import mlflow
import os
experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")
if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
raise Exception("Environment variables are not configured correctly.")
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
"experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
Databricks でホストされているノートブックで開発する
ステップ 1: ノートブックを作成する
Databricks ノートブックを作成すると、生成AIアプリケーションのコンテナである MLflow エクスペリメントが作成されます。エクスペリメントの詳細については、「 データ モデル」を参照してください。
- Databricks ワークスペースを開きます。
- 左側のサイドバーの上部にある[ 新規 ]に移動します。
- [ノートブック] をクリックします。
手順 2: MLflow をインストールする
Databricks ランタイムには MLflow が含まれていますが、生成AI 機能を最大限に活用するには、最新バージョンに更新してください。
%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()
ステップ 3: 認証を構成する
Databricks ノートブック内で作業する場合、追加の認証設定は必要ありません。ノートブックは、ワークスペースと関連する MLflow エクスペリメントに自動的にアクセスできます。
ステップ 4: 接続を確認する
ノートブックのセルでこのコードを実行して、接続を確認します。ノートブックのセルの下に MLflow トレースが表示されます。
import mlflow
import os
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
次のステップ
これらの推奨アクションとチュートリアルで旅を続けてください。
- トレースを使用してアプリを計測可能にする (IDE) - ローカル IDE で 生成AI アプリに MLflow Tracing を追加する
- トレースを使用してアプリを計測可能にする (ノートブック) -MLflow Tracing Databricksノートブックに を追加する
- アプリの品質を評価する - アプリの品質を体系的にテストして改善します
リファレンスガイド
このガイドで説明されている概念と機能の詳細なドキュメントをご覧ください。
- MLflow エクスペリメント - 生成AI アプリケーションのエクスペリメント コンテナを理解する
- トレーシングの概念 - MLflow Tracingの基礎を学ぶ
- Databricks 認証 - 利用可能なすべての認証方法を調べる