AutoMLによる予測 (サーバレス)

備考

プレビュー

この機能はパブリックプレビュー段階です。

この記事では、 Databricksモデルトレーニング UI を使用してサーバーレス予測エクスペリメントを実行する方法を示します。

Databricksモデルトレーニング - 予測は、フルマネージドコンピュートリソース上で実行しながら、最適なアルゴリズムとハイパーパラメーターを自動的に選択することにより、時系列データの予測を簡素化します。

サーバレスの予測とクラシックコンピュートの予測の違いについては、サーバレスの予測とクラシックコンピュートの予測を参照してください。

必要条件

Unity Catalogテーブルとして保存された時系列列を持つトレーニングデータ。
ワークスペースでサーバレス下り制御が有効になっている場合、 pypi.org 許可ドメイン リストに追加する必要があります。サーバレス出力制御については、「ネットワークポリシーの管理」を参照してください。

UI を使用した予測エクスペリメントの作成

Databricks ランディングページに移動し、サイドバーの エクスペリメント をクリックします。

予測タイルで、 トレーニングの開始 を選択します。
アクセスできる Unity Catalog テーブルの一覧から トレーニングデータ を選択します。
- 時間列 : 時系列の期間を含む列を選択します。列のタイプは timestamp または dateである必要があります。
- 予測頻度 : 入力データの頻度を表す時間単位を選択します。たとえば、分、時間、日、月などです。これにより、時系列の粒度が決まります。
- 予測期間 : 選択した周波数の単位数を指定して、将来に予測します。予測頻度とともに、予測する時間単位と時間単位の数の両方を定義します。

注記

Auto-ARIMA アルゴリズムを使用するには、時系列の周波数が規則的で、任意の 2 つのポイント間の間隔が時系列全体で同じである必要があります。AutoML は、欠落しているタイムステップを、それらの値に前の値で埋めることで処理します。

モデルで予測する 予測ターゲット列 を選択します。
必要に応じて、Unity Catalog テーブルの 予測データパス を指定して、出力予測を格納します。
モデル登録 のためのUnity Catalogロケーションと名前を選択します。
必要に応じて、 詳細オプション を設定します。
- エクスペリメント名 : MLflow エクスペリメント名を指定します。
- 時系列識別子列 - 複数系列予測の場合は、個々の時系列を識別する列を選択します。 Databricks は、これらの列によってデータを異なる時系列としてグループ化し、各シリーズのモデルを個別にトレーニングします。
- プライマリメトリクス : 最適なモデルの評価と選択に使用するプライマリメトリクスを選択します。
- トレーニングフレームワーク : AutoML で探索するフレームワークを選択します。
- 分割列 : カスタムデータ分割を含む列を選択します。値は "train"、"validate"、"test" である必要があります。
- 重み列 : 時系列の重み付けに使用する列を指定します。特定の時系列のすべてのサンプルは、同じ重みを持つ必要があります。重みは [0, 10000] の範囲である必要があります。
- 休日の地域 : モデルトレーニングで共変量として使用する休日の地域を選択します。
- タイムアウト : AutoML エクスペリメントの最大時間を設定します。

エクスペリメントを実行し、結果を監視する

AutoMLエクスペリメントを開始するには、 トレーニングの開始 をクリックします。エクスペリメントトレーニングページから、次の操作を実行できます。

エクスペリメントはいつでも停止できます。
モニターの実行。
任意の実行の実行ページに移動します。

さらに、エクスペリメントのステータスは、次の段階を経るときに確認できます。

前処理： 欠損値を代入し、データをトレーニング、検証、およびテストセットに分割することにより、入力テーブルを検証して準備します。この段階では、カテゴリ特徴のワンホットエンコーディングなどの自動特徴生成処理も行われます。
調律： さまざまな予測アルゴリズムを探索し、ハイパーパラメータを調整します。
訓練： 選択した最適な構成で最終モデルをトレーニングし、評価します。パスが指定されている場合は、 Unity Catalog でモデルを登録します。

結果を表示するか、最適なモデルを使用する

トレーニングが完了すると、予測結果は指定された Delta テーブルに格納され、最適なモデルが Unity Catalog に登録されます。

エクスペリメントページでは、次の手順から選択します。

予測の表示 を選択して、予測結果テーブルを表示します。
バッチ推論ノートブック を選択して、最適なモデルを使用してバッチ推論用の自動生成されたノートブックを開きます。
サービングエンドポイントの作成 を選択して、最適なモデルをモデルサービングエンドポイントにデプロイします。

サーバレスの予測 vs. クラシックコンピュートの予測

次の表は、サーバレスの予測と従来のコンピュートによる予測の違いをまとめたものです

機能	サーバレス予測	クラシックコンピュート予測
コンピュートインフラストラクチャ	Databricks コンピュートの設定を管理し、コストとパフォーマンスを自動的に最適化します。	ユーザー構成のコンピュート
ガバナンス	Unity Catalogに登録されたモデルとアーティファクト	ユーザー構成のワークスペースファイルストア
アルゴリズムの選択	統計モデルとディープラーニングニューラルネットアルゴリズム DeepAR	統計モデル
特徴量ストアの統合	サポートされていない	サポート
自動生成されたノートブック	バッチ推論ノートブック	すべての試用版のソースコード
ワンクリックモデルサービングデプロイメント	サポート	サポートされていません
カスタムのトレーニング/検証/テスト分割	サポート	サポートされていない
個々の時系列のカスタム重み付け	サポート	サポートされていない

機能	サーバレス予測	クラシックコンピュート予測
コンピュートインフラストラクチャ	Databricks コンピュートの設定を管理し、コストとパフォーマンスを自動的に最適化します。	ユーザー構成のコンピュート
ガバナンス	Unity Catalogに登録されたモデルとアーティファクト	ユーザー構成のワークスペースファイルストア
アルゴリズムの選択	統計モデルとディープラーニングニューラルネットアルゴリズム DeepAR	統計モデル
特徴量ストアの統合	サポートされていない	サポート
自動生成されたノートブック	バッチ推論ノートブック	すべての試用版のソースコード
ワンクリックモデルサービングデプロイメント	サポート	サポートされていません
カスタムのトレーニング/検証/テスト分割	サポート	サポートされていない
個々の時系列のカスタム重み付け	サポート	サポートされていない

必要条件​

UI を使用した予測エクスペリメントの作成​

エクスペリメントを実行し、結果を監視する​

結果を表示するか、最適なモデルを使用する​

サーバレスの予測 vs. クラシック コンピュートの予測​

必要条件

UI を使用した予測エクスペリメントの作成

エクスペリメントを実行し、結果を監視する

結果を表示するか、最適なモデルを使用する

サーバレスの予測 vs. クラシックコンピュートの予測