メインコンテンツまでスキップ

serving-endpoints コマンド グループ

注記

この情報は、Databricks CLI バージョン 0.205 以降に適用されます。Databricks CLI は パブリック プレビュー段階です。

Databricks CLI 使用には、使用状況データを含む Databricks ライセンス および Databricks プライバシー通知が適用されます。

Databricks CLI内のserving-endpointsコマンドグループを使用すると、モデルサービングエンドポイントを作成、更新、削除できます。「 モデルサービングエンドポイントの管理」を参照してください。

Databricks サービング エンドポイント ビルド ログ

提供された提供されたモデルに関連付けられたビルド ログを取得します。

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

引数

NAME

提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。

SERVED_MODEL_NAME

ビルドログが取得される提供モデルの名前。このフィールドは必須です。

オプション

グローバルフラグ

databricks serving-endpoints create

新しい配信エンドポイントを作成します。

databricks serving-endpoints create NAME [flags]

引数

NAME

サービスエンドポイントの名前。このフィールドは必須であり、Databricks ワークスペース全体で一意である必要があります。エンドポイント名は、英数字、ダッシュ、アンダースコアで構成できます。

オプション

--budget-policy-id string

サービスエンドポイントに適用される予算ポリシー。

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

--no-wait

NOT_UPDATING状態に到達するのを待たないでください

--route-optimized

サービスエンドポイントのルート最適化を有効にします。

--timeout duration

NOT_UPDATING状態に達するまでの最大時間(デフォルトは 20 分 0 秒)

グローバルフラグ

databricks serving-endpoints delete

配信エンドポイントを削除します。

databricks serving-endpoints delete NAME [flags]

引数

NAME

削除するサービスエンドポイントの名前。

オプション

グローバルフラグ

databricks serving-endpoints export-metrics

提供されたサービングエンドポイントに関連付けられたメトリクスを、PrometheusまたはOpenMetricsの公開形式で取得します。

databricks serving-endpoints export-metrics NAME [flags]

引数

NAME

メトリクスを取得するサービングエンドポイントの名前。 このフィールドは必須です。

オプション

グローバルフラグ

databricks serving-endpoints get

1 つのサービス エンドポイントの詳細を取得します。

databricks serving-endpoints get NAME [flags]

引数

NAME

サービスエンドポイントの名前。このフィールドは必須です。

オプション

グローバルフラグ

databricks serving-endpoints get-open-api

サービスエンドポイントのクエリスキーマをOpenAPI形式で取得します。スキーマには、サポートされているパス、入出力形式、およびデータ型に関する情報が含まれています。

databricks serving-endpoints get-open-api NAME [flags]

引数

NAME

提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。

オプション

グローバルフラグ

Databricks サービング エンドポイントの一覧

すべてのサービス提供エンドポイントを取得します。

databricks serving-endpoints list [flags]

引数

なし

オプション

グローバルフラグ

databricks serving-endpoints logs

提供されたサービスモデルに関連付けられたサービスログを取得します。

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

引数

NAME

提供されたモデルが属する提供エンドポイントの名前。このフィールドは必須です。

SERVED_MODEL_NAME

ログが取得される提供されたモデルの名前。このフィールドは必須です。

オプション

グローバルフラグ

databricks serving-endpoints patch

配信エンドポイントのタグを追加または削除します。

databricks serving-endpoints patch NAME [flags]

引数

NAME

パッチを適用するタグを持つサービスエンドポイントの名前。このフィールドは必須です。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

グローバルフラグ

databricks serving-endpoints put

サービスエンドポイントのレート制限を更新します。

注記

非推奨: 代わりに AI Gateway を使用してレート制限を管理してください。

databricks serving-endpoints put NAME [flags]

引数

NAME

レート制限が更新されるサービスエンドポイントの名前。このフィールドは必須です。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

グローバルフラグ

databricks serving-endpoints put-ai-gateway

サービスエンドポイントの AI ゲートウェイを更新します。外部モデル、プロビジョニング スループット、およびトークン単位の従量課金エンドポイントは完全にサポートされています。エージェントエンドポイントは現在、推論テーブルのみをサポートしています。

databricks serving-endpoints put-ai-gateway NAME [flags]

引数

NAME

AI ゲートウェイが更新されているサービス エンドポイントの名前。このフィールドは必須です。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

グローバルフラグ

databricks serving-endpoints query

サービング エンドポイントにクエリを実行します。

databricks serving-endpoints query NAME [flags]

引数

NAME

サービスエンドポイントの名前。このフィールドは必須です。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

--max-tokens int

max トークン フィールドは、 完了チャット、外部および基盤モデル サービス エンドポイントにのみ使用されます。

--n int

n (候補の数) フィールドは、 完了チャット、外部および基盤モデル 、サービスエンドポイントにのみ使用されます。

--stream

ストリームフィールドは、 完了チャット、外部および基盤モデル 、サービスエンドポイントにのみ使用されます。

--temperature float

温度フィールドは、 エンドポイント を提供する完了と チャットの外部モデルと基盤モデル にのみ使用されます。

グローバルフラグ

databricks serving-endpoints update-config

サービスエンドポイントのサービスエンティティ、それらのサービスエンティティのコンピュート設定、およびエンドポイントのトラフィック設定の任意の組み合わせを更新します。 すでに更新が進行中のエンドポイントは、現在の更新が完了するか失敗するまで更新できません。

databricks serving-endpoints update-config NAME [flags]

引数

NAME

更新するサービスエンドポイントの名前。このフィールドは必須です。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

--no-wait

NOT_UPDATING状態に到達するのを待たないでください

--timeout duration

NOT_UPDATING状態に達するまでの最大時間(デフォルトは 20 分 0 秒)

グローバルフラグ

databricks serving-endpoints get-permission-levels

エンドポイントの提供アクセス許可レベルを取得します。

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

引数

SERVING_ENDPOINT_ID

アクセス許可を取得または管理するサービス エンドポイント。

オプション

グローバルフラグ

databricks serving-endpoints get-permissions

エンドポイントの提供アクセス許可を取得します。

サービスエンドポイントのアクセス許可を取得します。サービスエンドポイントは、ルートオブジェクトからアクセス許可を継承できます。

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

引数

SERVING_ENDPOINT_ID

アクセス許可を取得または管理するサービス エンドポイント。

オプション

グローバルフラグ

databricks serving-endpoints set-permissions

提供エンドポイントのアクセス許可を設定します。

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

引数

SERVING_ENDPOINT_ID

アクセス許可を取得または管理するサービス エンドポイント。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

グローバルフラグ

databricks serving-endpoints update-permissions

サービングエンドポイントのアクセス許可を更新します。サービスエンドポイントは、ルートオブジェクトからアクセス許可を継承できます。

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

引数

SERVING_ENDPOINT_ID

アクセス許可を取得または管理するサービス エンドポイント。

オプション

--json JSON

インライン JSON 文字列、またはリクエスト本文を含む JSON ファイルへの@path。

グローバルフラグ

グローバルフラグ

--debug

デバッグログを有効にするかどうか。

-h または --help

Databricks CLI、関連するコマンド グループ、または関連するコマンドのヘルプを表示します。

--log-file string

出力ログの書き込み先となるファイルを表す文字列。このフラグが指定されていない場合、デフォルトでは出力ログが stderr に書き込まれます。

--log-format format

ログ・フォーマット・タイプ ( text または json) 。デフォルト値は textです。

--log-level string

ログ形式レベルを表す文字列。指定しない場合、ログ・フォーマット・レベルは使用不可になります。

-o, --output タイプ

コマンド出力タイプ text または json。デフォルト値は textです。

-p, --profile string

コマンドの実行に使用する ~/.databrickscfg ファイル内のプロファイルの名前。このフラグが指定されていない場合、存在する場合は、 DEFAULT という名前のプロファイルが使用されます。

--progress-format format

進行状況ログを表示する形式: defaultappendinplacejson

-t, --target string

該当する場合は、使用するバンドル・ターゲット