AutoML による予測 (サーバレス)

プレビュー

この機能はパブリックプレビュー段階です。

この記事では、 Mosaic AI Model トレーニング UI を使用して、サーバレス forecasting エクスペリメントを実行する方法について説明します。

Mosaic AI Model トレーニング - forecasting は、フルマネージド コンピュート リソースで実行しながら、最適なアルゴリズムとハイパーパラメータを自動的に選択することで、時系列データの予測を簡素化します。

サーバレス forecasting とクラシック コンピュート forecastingの違いについては、 サーバレス forecasting と classic コンピュート forecastingを参照してください。

要件

  • Unity Catalogテーブルとして保存された時系列列を持つトレーニングデータ。

UI を使用した予測エクスペリメントの作成

Databricks ランディングページに移動し、サイドバーの エクスペリメント をクリックします。

  1. 予測タイルで、トレーニングの開始 を選択します。

  2. アクセスできる Unity Catalog テーブルの一覧から [トレーニング データ ] を選択します。

    • 時間列: 時系列の期間を含む列を選択します。 列のタイプは timestamp または dateである必要があります。

    • 予測頻度: 入力データの頻度を表す時間単位を選択します。 たとえば、分、時間、日、月などです。 これにより、時系列の粒度が決まります。

    • 予測期間: 選択した周波数の単位数を指定して、将来に予測します。 予測頻度とともに、予測する時間単位と時間単位の数の両方を定義します。

    注:

    Auto-ARIMA アルゴリズムを使用するには、時系列の周波数が規則的で、任意の 2 つのポイント間の間隔が時系列全体で同じである必要があります。AutoML は、欠落しているタイム ステップを、それらの値に前の値で埋めることで処理します。

  3. モデルで予測する 予測ターゲット列 を選択します。

  4. 必要に応じて、Unity Catalog テーブルの 予測データ パス を指定して、出力予測を格納します。

    サーバレス予測UIのスクリーンショット。
  5. 場所と名前 モデル登録 を選択します。Unity Catalog

  6. 必要に応じて、 詳細オプションを設定します。

    • エクスペリメント名: MLflow エクスペリメント名を指定します。

    • 時系列識別子列 - 複数系列予測の場合は、個々の時系列を識別する列を選択します。 Databricks は、これらの列によってデータを異なる時系列としてグループ化し、各シリーズのモデルを個別にトレーニングします。

    • Primary メトリクス: 最適なモデルの評価と選択に使用する primary メトリクスを選択します。

    • トレーニング フレームワーク: AutoML で探索するフレームワークを選択します。

    • 分割列: カスタムデータ分割を含む列を選択します。 値は "train"、"validate"、"test" である必要があります。

    • 重み列: 時系列の重み付けに使用する列を指定します。 特定の時系列のすべてのサンプルは、同じ重みを持つ必要があります。 重みは [0, 10000] の範囲である必要があります。

    • 休日の地域: モデル トレーニングで共変量として使用する休日の地域を選択します。

    • タイムアウト: AutoML エクスペリメントの最大時間を設定します。

エクスペリメントを実行し結果を確認する

AutoMLエクスペリメントを開始するには、[トレーニングの開始] をクリックします。エクスペリメント トレーニング ページから、次の操作を実行できます。

  • エクスペリメントはいつでも停止できます。

  • モニターの実行。

  • 任意の実行の実行ページに移動します。

結果を表示するか、最適なモデルを使用する

トレーニングが完了すると、予測結果は指定された Delta テーブルに格納され、最適なモデルが Unity Catalog に登録されます。

エクスペリメントページでは、次の手順から選択します。

  • 予測の表示 を選択して、予測結果テーブルを表示します。

  • [ バッチ推論ノートブック ] を選択して、最適なモデルを使用してバッチ推論用の自動生成されたノートブックを開きます。

  • [ Create serving endpoint] (サービングエンドポイントの作成 ) を選択して、最適なモデルをモデルサービングエンドポイントにデプロイします。

サーバレス forecasting vs. クラシック コンピュート forecasting

次の表は、サーバレスの予測と従来のコンピュートによる予測の違いをまとめたものです

特徴量

サーバレス forecasting

クラシックコンピュート予測

コンピュート インフラストラクチャ

Databricks コンピュートの設定を管理し、コストとパフォーマンスを自動的に最適化します。

ユーザー構成のコンピュート

ガバナンス

Unity Catalogに登録されたモデルとアーティファクト

ユーザー構成のワークスペース ファイル ストア

アルゴリズムの選択

統計モデル とディープラーニングニューラルネットアルゴリズム DeepAR

統計モデル

機能ストアの統合

サポートされていない

サポート

自動生成されたノートブック

バッチ推論ノートブック

すべての試用版のソースコード

ワンクリックモデルサービングデプロイメント

サポート

サポートされていません

カスタムのトレーニング/検証/テスト分割

サポート

サポートされていない

個々の時系列のカスタム重み付け

サポート

サポートされていない