メインコンテンツまでスキップ

AutoML 予測

注記

この機能はプレビュー段階です。

この記事では、 Mosaic AI Model トレーニング UI を使用して予測エクスペリメントを実行する方法について説明します。

Mosaic AI Model トレーニング - 予測 は、フルマネージド コンピュート リソースで実行しながら、最適なアルゴリズムとハイパーパラメータを自動的に選択することで、時系列データの予測を簡素化します。

必要条件

  • Unity Catalogテーブルとして保存された時系列列を持つトレーニングデータ。

UI を使用した予測エクスペリメントの作成

SAP Databricks ランディングページに移動し、サイドバーの 「エクスペリメント 」をクリックします。

  1. 予測 タイルで、 トレーニングの開始 を選択します。

  2. アクセスできる Unity Catalog テーブルの一覧から トレーニング データ を選択します。

    • 時間列 : 時系列の期間を含む列を選択します。列のタイプは timestamp または dateである必要があります。

    • 予測頻度 : 入力データの頻度を表す時間単位を選択します。たとえば、分、時間、日、月などです。これにより、時系列の粒度が決まります。

    • 予測期間 : 選択した周波数の単位数を指定して、将来に予測します。予測頻度とともに、予測する時間単位と時間単位の数の両方を定義します。

注記

Auto-ARIMA アルゴリズムを使用するには、時系列の周波数が規則的で、任意の 2 つのポイント間の間隔が時系列全体で同じである必要があります。AutoML は、欠落しているタイム ステップを、それらの値に前の値で埋めることで処理します。

  1. モデルで予測する 予測ターゲット列 を選択します。

  2. 必要に応じて、Unity Catalog テーブルの 予測データ パス を指定して、出力予測を格納します。

  3. モデル登録 のためのUnity Catalogロケーションと名前を選択します。

  4. 必要に応じて、 詳細オプション を設定します。

    • エクスペリメント名 : MLflow エクスペリメント名を指定します。
    • 時系列識別子列 - 複数系列予測の場合は、個々の時系列を識別する列を選択します。Databricks は、これらの列によってデータを異なる時系列としてグループ化し、各シリーズのモデルを個別にトレーニングします。
    • Primary メトリクス : 最適なモデルの評価と選択に使用する primary メトリクスを選択します。
    • トレーニング フレームワーク : AutoML で探索するフレームワークを選択します。
    • 分割列 : カスタムデータ分割を含む列を選択します。値は "train"、"validate"、"test" である必要があります。
    • 重み列 : 時系列の重み付けに使用する列を指定します。特定の時系列のすべてのサンプルは、同じ重みを持つ必要があります。重みは [0, 10000] の範囲である必要があります。
    • 休日の地域 : モデル トレーニングで共変量として使用する休日の地域を選択します。
    • タイムアウト : AutoML エクスペリメントの最大時間を設定します。

エクスペリメントを実行し、結果を監視する

AutoMLエクスペリメントを開始するには、 トレーニングの開始 をクリックします。エクスペリメント トレーニング ページから、次の操作を実行できます。

  • エクスペリメントはいつでも停止できます。
  • モニターの実行。
  • 任意の実行の実行ページに移動します。

さらに、エクスペリメントのステータスは、次の段階を経るときに確認できます。

  1. 前処理: 欠損値を代入し、データをトレーニング、検証、およびテストセットに分割することにより、入力テーブルを検証して準備します。この段階では、カテゴリ特徴のワンホットエンコーディングなどの自動特徴生成処理も行われます。
  2. 調律: さまざまな予測アルゴリズムを探索し、ハイパーパラメータを調整します。
  3. 訓練: 選択した最適な構成で最終モデルをトレーニングし、評価します。パスが指定されている場合は、 Unity Catalog でモデルを登録します。

結果を表示するか、最適なモデルを使用する

トレーニングが完了すると、予測結果は指定された Delta テーブルに格納され、最適なモデルが Unity Catalog に登録されます。

エクスペリメントページでは、次の手順から選択します。

  • 予測の表示 を選択して、予測結果テーブルを表示します。
  • バッチ推論ノートブック を選択して、最適なモデルを使用してバッチ推論用の自動生成されたノートブックを開きます。
  • サービングエンドポイントの作成 を選択して、最適なモデルをモデルサービングエンドポイントにデプロイします。