AutoMLによる予測 (サーバレス)
プレビュー
この機能はパブリックプレビュー段階です。
この記事では、 Mosaic AI Model トレーニング UI を使用して、サーバレス予測 エクスペリメントを実行する方法について説明します。
Mosaic AI Model トレーニング - 予測 は、フルマネージド コンピュート リソースで実行しながら、最適なアルゴリズムとハイパーパラメータを自動的に選択することで、時系列データの予測を簡素化します。
サーバレスの予測 とクラシック コンピュートの予測の違いについては、 サーバレス 予測 と クラシック コンピュートの予測を参照してください。
要件
Unity Catalogテーブルとして保存された時系列列を持つトレーニングデータ。
ワークスペースで Secure Egress Gateway (SEG) が有効になっている場合は、
pypi.org
を [許可されたドメイン ] リストに追加する必要があります。 サーバレス egress 制御のネットワーク ポリシーの管理を参照してください。
UIを使用した予測エクスペリメントの作成
Databricks ランディングページに移動し、サイドバーの エクスペリメント をクリックします。
予測タイルで、トレーニングの開始 を選択します。
アクセスできる Unity Catalog テーブルの一覧から トレーニング データを選択します。
時間列: 時系列の期間を含む列を選択します。 列のタイプは
timestamp
またはdate
である必要があります。予測頻度: 入力データの頻度を表す時間単位を選択します。 たとえば、分、時間、日、月などです。 これにより、時系列の粒度が決まります。
予測期間: 選択した周波数の単位数を指定して、将来に予測します。 予測頻度とともに、予測する時間単位と時間単位の数の両方を定義します。
注:
Auto-ARIMA アルゴリズムを使用するには、時系列の周波数が規則的で、任意の 2 つのポイント間の間隔が時系列全体で同じである必要があります。AutoML は、欠落しているタイム ステップを、それらの値に前の値で埋めることで処理します。
モデルで予測する 予測ターゲット列 を選択します。
必要に応じて、Unity Catalog テーブルの 予測データ パス を指定して、出力予測を格納します。
モデル登録 のためのUnity Catalogロケーションと名前を選択します。
必要に応じて、 詳細オプションを設定します。
エクスペリメント名: MLflow エクスペリメント名を指定します。
時系列識別子列 - 複数系列予測の場合は、個々の時系列を識別する列を選択します。 Databricks は、これらの列によってデータを異なる時系列としてグループ化し、各シリーズのモデルを個別にトレーニングします。
Primary メトリクス: 最適なモデルの評価と選択に使用する primary メトリクスを選択します。
トレーニング フレームワーク: AutoML で探索するフレームワークを選択します。
分割列: カスタムデータ分割を含む列を選択します。 値は "train"、"validate"、"test" である必要があります。
重み列: 時系列の重み付けに使用する列を指定します。 特定の時系列のすべてのサンプルは、同じ重みを持つ必要があります。 重みは [0, 10000] の範囲である必要があります。
休日の地域: モデル トレーニングで共変量として使用する休日の地域を選択します。
タイムアウト: AutoML エクスペリメントの最大時間を設定します。
エクスペリメントを実行し結果を確認する
AutoMLエクスペリメントを開始するには、トレーニングの開始をクリックします。エクスペリメント トレーニング ページから、次の操作を実行できます。
エクスペリメントはいつでも停止できます。
モニターの実行。
任意の実行の実行ページに移動します。
結果を表示するか、最適なモデルを使用する
トレーニングが完了すると、予測結果は指定された Delta テーブルに格納され、最適なモデルが Unity Catalog に登録されます。
エクスペリメントページでは、次の手順から選択します。
予測の表示 を選択して、予測結果テーブルを表示します。
バッチ推論ノートブックを選択して、最適なモデルを使用してバッチ推論用の自動生成されたノートブックを開きます。
サービングエンドポイントの作成を選択して、最適なモデルをモデルサービングエンドポイントにデプロイします。
サーバレスの予測 vs. クラシック コンピュートの予測
次の表は、サーバレスの予測と従来のコンピュートによる予測の違いをまとめたものです
特徴量 |
サーバレス 予測 |
クラシックコンピュート予測 |
---|---|---|
コンピュート インフラストラクチャ |
Databricks コンピュートの設定を管理し、コストとパフォーマンスを自動的に最適化します。 |
ユーザー構成のコンピュート |
ガバナンス |
Unity Catalogに登録されたモデルとアーティファクト |
ユーザー構成のワークスペース ファイル ストア |
アルゴリズムの選択 |
||
特徴量ストアの統合 |
サポートされていない |
|
自動生成されたノートブック |
バッチ推論ノートブック |
すべての試用版のソースコード |
ワンクリックモデルサービングデプロイメント |
サポート |
サポートされていません |
カスタムのトレーニング/検証/テスト分割 |
サポート |
サポートされていない |
個々の時系列のカスタム重み付け |
サポート |
サポートされていない |