Feature エンジニアリングとワークスペースFeature Storeリポジトリ

このページには、 Unity Catalog とワークスペースの両方の Feature Store シナリオでの特徴エンジニアリングについて、Databricks の特徴エンジニアリング ワークフローを示すノートブックの例が含まれています。

注:

Databricks Runtime13.3LTS 以降では、主キーを持つDelta Unity Catalog内の テーブルは自動的に特徴量テーブルとなり、モデルのトレーニングや推論に使用できます。Unity Catalogに登録されているテーブルを特徴量テーブルとして使用すると、すべてのUnity Catalog機能が特徴量テーブルで自動的に使用できるようになります。

基本的な特徴エンジニアリングの例

基本的な特徴量エンジニアリングのサンプル ノートブックでは、特徴量テーブルを作成し、それを使用してモデルをトレーニングし、自動特徴量検索を使用してバッチ スコアリングを実行する方法について説明します。 また、特徴量エンジニアリング UI を紹介し、それを使用して機能を検索し、機能の作成方法と使用方法を理解する方法も示します。

Unity Catalogでの特徴量エンジニアリングの基本となるサンプルノートブック

ノートブックを新しいタブで開く

ワークスペースで Unity Catalogが有効になっていない場合は、次のノートブックを使用します。

Basic ワークスペース Feature Store のサンプル ノートブック

ノートブックを新しいタブで開く

ポイントインタイムルックアップ を使用したタクシーの例

タクシーのサンプル ノートブックは、特徴量を作成して更新し、モデルのトレーニングとバッチ推論に使用するプロセスを示しています。

Unity Catalogでの特徴量エンジニアリングのタクシーサンプル ノートブック

ノートブックを新しいタブで開く

ワークスペースで Unity Catalogが有効になっていない場合は、次のノートブックを使用します。

ワークスペース Feature Store taxi example notebook

ノートブックを新しいタブで開く

Feature Servingエンドポイントの作成

次のノートブックは、Databricks SDK を使用して、Databricks Online Tables を使用して特徴量サービングエンドポイントを作成する方法を示しています。

機能オンラインテーブルを備えた特徴量サービングサンプルノートブック

ノートブックを新しいタブで開く

次のノートブックは、Databricks SDK を使用して、サードパーティのオンライン ストアを使用して特徴量サービングエンドポイントを作成する方法を示しています。

DynamoDB を使用した特徴量サービングサンプルノートブック

ノートブックを新しいタブで開く