AutoMLによる予測 (サーバレス)
プレビュー
この機能は パブリック プレビュー段階です。
この記事では、 Mosaic AI Model トレーニング UI を使用して、サーバレス予測 エクスペリメントを実行する方法について説明します。
Mosaic AI Model トレーニング - 予測 は、フルマネージド コンピュート リソースで実行しながら、最適なアルゴリズムとハイパーパラメータを自動的に選択することで、時系列データの予測を簡素化します。
サーバレスの予測とクラシック コンピュートの予測の違いについては、 サーバレスの予測とクラシックコンピュートの予測を参照してください。
必要条件
-
Unity Catalogテーブルとして保存された時系列列を持つトレーニングデータ。
-
ワークスペースで Secure Egress Gateway (SEG) が有効になっている場合は、
pypi.org
を [許可されたドメイン ] リストに追加する必要があります。 サーバレス egress 制御のネットワーク ポリシーの管理を参照してください。
UI を使用した予測エクスペリメントの作成
Databricks ランディングページに移動し、サイドバーの エクスペリメント をクリックします。
-
予測 タイルで、 トレーニングの開始 を選択します。
-
アクセスできる Unity Catalog テーブルの一覧から トレーニング データ を選択します。
-
時間列 : 時系列の期間を含む列を選択します。 列のタイプは
timestamp
またはdate
である必要があります。 -
予測頻度 :入力データの頻度を表す時間単位を選択してください。 たとえば、分、時間、日、月などです。 これにより、時系列の粒度が決まります。
-
予測期間 : 選択した周波数の単位数を指定して、将来に予測します。 予測頻度とともに、予測する時間単位と時間単位の数の両方を定義します。
-
Auto-ARIMA アルゴリズムを使用するには、時系列の周波数が規則的で、任意の 2 つのポイント間の間隔が時系列全体で同じである必要があります。AutoML は、欠落しているタイム ステップを、それらの値に前の値で埋めることで処理します。
-
モデルで予測する 予測ターゲット列 を選択します。
-
必要に応じて、Unity Catalog テーブルの 予測データ パス を指定して、出力予測を格納します。
-
モデル登録 のためのUnity Catalogロケーションと名前を選択します。
-
必要に応じて、 詳細オプション を設定します。
- エクスペリメント名 : MLflow エクスペリメント名を指定します。
- 時系列識別子列 - 複数系列予測の場合は、個々の時系列を識別する列を選択します。 Databricks は、これらの列によってデータを異なる時系列としてグループ化し、各シリーズのモデルを個別にトレーニングします。
- Primary メトリクス : 最適なモデルの評価と選択に使用する primary メトリクスを選択します。
- トレーニング フレームワーク : AutoML で探索するフレームワークを選択します。
- 分割列 : カスタムデータ分割を含む列を選択します。 値は "train"、"validate"、"test" である必要があります。
- 重み列 : 時系列の重み付けに使用する列を指定します。 特定の時系列のすべてのサンプルは、同じ重みを持つ必要があります。 重みは [0, 10000] の範囲である必要があります。
- 休日の地域 : モデル トレーニングで共変量として使用する休日の地域を選択します。
- タイムアウト : AutoML エクスペリメントの最大時間を設定します。
エクスペリメントを実行し、結果を監視する
AutoMLエクスペリメントを開始するには、 トレーニングの開始 をクリックします。エクスペリメント トレーニング ページから、次の操作を実行できます。
- エクスペリメントはいつでも停止できます。
- モニターの実行。
- 任意の実行の実行ページに移動します。
結果を表示するか、最適なモデルを使用する
トレーニングが完了すると、予測結果は指定された Delta テーブルに格納され、最適なモデルが Unity Catalog に登録されます。
エクスペリメントページでは、次の手順から選択します。
- 予測の表示 を選択して、予測結果テーブルを表示します。
- バッチ推論ノートブック を選択して、最適なモデルを使用してバッチ推論用の自動生成されたノートブックを開きます。
- サービングエンドポイントの作成 を選択して、最適なモデルをモデルサービングエンドポイントにデプロイします。
サーバレスの予測 vs. クラシック コンピュートの予測
次の表は、サーバレスの予測と従来のコンピュートによる予測の違いをまとめたものです
機能 | サーバレス 予測 | クラシックコンピュート予測 |
---|---|---|
コンピュート インフラストラクチャ | Databricks コンピュートの設定を管理し、コストとパフォーマンスを自動的に最適化します。 | ユーザー構成のコンピュート |
ガバナンス | Unity Catalogに登録されたモデルとアーティファクト | ユーザー構成のワークスペース ファイル ストア |
アルゴリズムの選択 | ||
特徴量ストアの統合 | サポートされていない | |
自動生成されたノートブック | バッチ推論ノートブック | すべての試用版のソースコード |
ワンクリックモデルサービングデプロイメント | サポート | サポートされていません |
カスタムのトレーニング/検証/テスト分割 | サポート | サポートされていない |
個々の時系列のカスタム重み付け | サポート | サポートされていない |