Unity AI Gatewayエンドポイントの設定
ベータ版
この機能はベータ版です。アカウント管理者は、アカウント コンソールの [プレビュー] ページからこの機能へのアクセスを制御できます。 「Databricks プレビューの管理」を参照してください。
このページでは、Unity AI Gatewayのエンドポイントを設定する方法について説明します。
要件
- お客様のアカウントでUnity AI Gatewayのプレビュー版が有効になりました。Databricksのプレビューを管理するを参照してください。
- Unity AI Gateway がサポートされるリージョン内のDatabricksワークスペース。
- ワークスペースで Unity Catalog が有効になりました。「Unity Catalog のワークスペースを有効にする」を参照してください。
Unity AI Gatewayエンドポイントを作成する
Unity AI Gatewayエンドポイントを作成するには:
- サイドバーで、 AI ゲートウェイ をクリックします。
- Unity AI Gatewayエンドポイントの作成を クリックします。
- エンドポイント名とプライマリ モデルを構成します。
- 作成 をクリックします。
エンドポイントの機能を構成する
Unity AI Gatewayのエンドポイントを更新することで、機能を有効化または無効化できます。Unity AI Gatewayの設定更新が反映されるまでには、最大1分かかる場合があります。
既存のエンドポイントでUnity AI Gatewayの機能を更新するには:
- AI ゲートウェイ ページからエンドポイントをクリックします。
- ゲートウェイ エンドポイントの詳細サイドバーで、更新する機能の横にある編集アイコンをクリックします。
- 変更を加えて、 「保存」 をクリックします。

以下の表は、利用可能なUnity AI Gatewayの機能と、それらの設定方法をまとめたものです。
機能 | 設定方法 | 詳細 |
|---|---|---|
デフォルトで有効になっています。 |
| |
推論テーブルを有効にする を選択して、リクエストと応答をログに記録します。 |
| |
1 分あたりのクエリ数 (QPM) または 1 分あたりのトークン数 (TPM) を構成するには、 レート制限 を選択します。 |
| |
ガードレール | コンテンツポリシーを設定するには、 「ガードレール」 を選択してください。 |
|
フォールバック | フォールバック モデルを構成するには、 「フォールバック モデルの追加」 を選択します。 |
|
交通分離 | 「トラフィック分割を追加」 を選択すると、リクエストが複数のモデルバックエンドに分散されます。 |
|
カスタムAPIs | 外部APIに接続するためのエンドポイントを作成する際は、 「カスタムAPI」 を選択してください。 |
|
次の図は、Unity AI Gatewayエンドポイントの宛先として3つのモデルが登録されているフォールバックの例を示しています。
- リクエストは最初にモデル 1 にルーティングされます。
- リクエストが 200 応答を返す場合、リクエストはモデル 1 で成功し、リクエストとその応答は使用状況追跡テーブルと推論テーブルに記録されます。
- リクエストがモデル 1 で
429または5XXエラーを返す場合、リクエストはエンドポイントの次のモデルであるモデル 2 にフォールバックします。 - リクエストがモデル 2 で
429または5XXエラーを返す場合、リクエストはエンドポイントの次のモデルであるモデル 3 にフォールバックします。 - リクエストがモデル 3 で
429または5XXエラーを返す場合、すべてのフォールバック モデルが試行されているため、リクエストは失敗します。失敗した要求と応答エラーは、使用状況追跡テーブルと推論テーブルに記録されます。
