serving-endpoints
コマンド グループ
この情報は、Databricks CLI バージョン 0.205 以降に適用されます。Databricks CLI は パブリック プレビュー段階です。
Databricks CLI 使用には、使用状況データを含む Databricks ライセンス および Databricks プライバシー通知が適用されます。
Databricks CLI内のserving-endpoints
コマンドグループを使用すると、モデルサービングエンドポイントを作成、更新、削除できます。「 モデルサービングエンドポイントの管理」を参照してください。
Databricks サービング エンドポイント ビルド ログ
提供された提供されたモデルに関連付けられたビルド ログを取得します。
databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]
引数
NAME
提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。
SERVED_MODEL_NAME
ビルドログが取得される提供モデルの名前。このフィールドは必須です。
オプション
databricks serving-endpoints create
新しい配信エンドポイントを作成します。
databricks serving-endpoints create NAME [flags]
引数
NAME
サービスエンドポイントの名前。このフィールドは必須であり、Databricks ワークスペース全体で一意である必要があります。エンドポイント名は、英数字、ダッシュ、アンダースコアで構成できます。
オプション
--budget-policy-id string
サービスエンドポイントに適用される予算ポリシー。
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
--no-wait
NOT_UPDATING状態に到達するのを待たないでください
--route-optimized
サービスエンドポイントのルート最適化を有効にします。
--timeout duration
NOT_UPDATING状態に達するまでの最大時間(デフォルトは 20 分 0 秒)
databricks serving-endpoints delete
配信エンドポイントを削除します。
databricks serving-endpoints delete NAME [flags]
引数
NAME
削除するサービスエンドポイントの名前。
オプション
databricks serving-endpoints export-metrics
提供されたサービングエンドポイントに関連付けられたメトリクスを、PrometheusまたはOpenMetricsの公開形式で取得します。
databricks serving-endpoints export-metrics NAME [flags]
引数
NAME
メトリクスを取得するサービングエンドポイントの名前。 このフィールドは必須です。
オプション
databricks serving-endpoints get
1 つのサービス エンドポイントの詳細を取得します。
databricks serving-endpoints get NAME [flags]
引数
NAME
サービスエンドポイントの名前。このフィールドは必須です。
オプション
databricks serving-endpoints get-open-api
サービスエンドポイントのクエリスキーマをOpenAPI形式で取得します。スキーマには、サポートされているパス、入出力形式、およびデータ型に関する情報が含まれています。
databricks serving-endpoints get-open-api NAME [flags]
引数
NAME
提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。
オプション
Databricks サービング エンドポイントの一覧
すべてのサービス提供エンドポイントを取得します。
databricks serving-endpoints list [flags]
引数
なし
オプション
databricks serving-endpoints logs
提供されたサービスモデルに関連付けられたサービスログを取得します。
databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]
引数
NAME
提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。
SERVED_MODEL_NAME
ログが取得される提供されたモデルの名前。このフィールドは必須です。
オプション
databricks serving-endpoints patch
配信エンドポイントのタグを追加または削除します。
databricks serving-endpoints patch NAME [flags]
引数
NAME
パッチを適用するタグを持つサービスエンドポイントの名前。このフィールドは必須です。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
databricks serving-endpoints put
サービスエンドポイントのレート制限を更新します。
非推奨: 代わりに AI Gateway を使用してレート制限を管理してください。
databricks serving-endpoints put NAME [flags]
引数
NAME
レート制限が更新されるサービスエンドポイントの名前。このフィールドは必須です。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
databricks serving-endpoints put-ai-gateway
サービスエンドポイントの AI ゲートウェイを更新します。外部モデル、プロビジョニング スループット、およびトークン単位の従量課金エンドポイントは完全にサポートされています。エージェントエンドポイントは現在、推論テーブルのみをサポートしています。
databricks serving-endpoints put-ai-gateway NAME [flags]
引数
NAME
AI ゲートウェイが更新されているサービス エンドポイントの名前。このフィールドは必須です。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
databricks serving-endpoints query
サービング エンドポイントにクエリを実行します。
databricks serving-endpoints query NAME [flags]
引数
NAME
サービスエンドポイントの名前。このフィールドは必須です。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
--max-tokens int
max トークン フィールドは、 完了 と チャット、外部および基盤モデル サービス エンドポイントにのみ使用されます。
--n int
n (候補の数) フィールドは、 完了 と チャット、外部および基盤モデル 、サービスエンドポイントにのみ使用されます。
--stream
ストリームフィールドは、 完了 と チャット、外部および基盤モデル 、サービスエンドポイントにのみ使用されます。
--temperature float
温度フィールドは、 エンドポイント を提供する完了と チャットの外部モデルと基盤モデル にのみ使用されます。
databricks serving-endpoints update-config
サービスエンドポイントのサービスエンティティ、それらのサービスエンティティのコンピュート設定、およびエンドポイントのトラフィック設定の任意の組み合わせを更新します。 すでに更新が進行中のエンドポイントは、現在の更新が完了するか失敗するまで更新できません。
databricks serving-endpoints update-config NAME [flags]
引数
NAME
更新するサービスエンドポイントの名前。このフィールドは必須です。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
--no-wait
NOT_UPDATING状態に到達するのを待たないでください
--timeout duration
NOT_UPDATING状態に達するまでの最大時間(デフォルトは 20 分 0 秒)
databricks serving-endpoints get-permission-levels
エンドポイントの提供アクセス許可レベルを取得します。
databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]
引数
SERVING_ENDPOINT_ID
アクセス許可を取得または管理するサービス エンドポイント。
オプション
databricks serving-endpoints get-permissions
エンドポイントの提供アクセス許可を取得します。
サービスエンドポイントのアクセス許可を取得します。サービスエンドポイントは、ルートオブジェクトからアクセス許可を継承できます。
databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]
引数
SERVING_ENDPOINT_ID
アクセス許可を取得または管理するサービス エンドポイント。
オプション
databricks serving-endpoints set-permissions
提供エンドポイントのアクセス許可を設定します。
databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]
引数
SERVING_ENDPOINT_ID
アクセス許可を取得または管理するサービス エンドポイント。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
databricks serving-endpoints update-permissions
サービングエンドポイントのアクセス許可を更新します。サービスエンドポイントは、ルートオブジェクトからアクセス許可を継承できます。
databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]
引数
SERVING_ENDPOINT_ID
アクセス許可を取得または管理するサービス エンドポイント。
オプション
--json JSON
インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。
グローバルフラグ
--debug
デバッグログを有効にするかどうか。
-h
または --help
Databricks CLI、関連するコマンド グループ、または関連するコマンドのヘルプを表示します。
--log-file
string
出力ログの書き込み先となるファイルを表す文字列。このフラグが指定されていない場合、デフォルトでは出力ログが stderr に書き込まれます。
--log-format
format
ログ・フォーマット・タイプ ( text
または json
) 。デフォルト値は text
です。
--log-level
string
ログ形式レベルを表す文字列。指定しない場合、ログ・フォーマット・レベルは使用不可になります。
-o, --output
タイプ
コマンド出力タイプ text
または json
。デフォルト値は text
です。
-p, --profile
string
コマンドの実行に使用する ~/.databrickscfg
ファイル内のプロファイルの名前。このフラグが指定されていない場合、存在する場合は、 DEFAULT
という名前のプロファイルが使用されます。
--progress-format
format
進行状況ログを表示する形式: default
、 append
、 inplace
、 json
-t, --target
string
該当する場合は、使用するバンドル・ターゲット