serving-endpoints
grupo de comando
Esta informação se aplica a Databricks CLI versões 0.205 e acima. A CLI do Databricks está em pré-visualização pública.
Databricks CLI O uso está sujeito à LicençaDatabricks e à Política de PrivacidadeDatabricks, incluindo qualquer disposição sobre Dados de Uso.
O grupo de comandos serving-endpoints
dentro do Databricks CLI permite criar, atualizar e excluir o endpoint servindo modelo. Consulte gerenciar servindo modelo endpoint.
databricks serving-endpoint build-logs
Recupera o build- logs e associado ao modelo servido fornecido.
databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Esse campo é obrigatório.
SERVED_MODEL_NAME
O nome do modelo servido que irá construir logs será recuperado. Esse campo é obrigatório.
Opções
databricks criar-ponto-de-terminação-de-serviço
Crie um novo servidor endpoint.
databricks serving-endpoints create NAME [flags]
Argumentos
NAME
O nome do servidor endpoint. Este campo é obrigatório e deve ser único em um Databricks workspace. Um nome de e-mail endpoint pode ser composto por caracteres alfanuméricos, traços e sublinhado.
Opções
--budget-policy-id string
A política de orçamento a ser aplicada ao endpoint em serviço.
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
--no-wait
não espere para atingir o estado NOT_UPDING
--route-optimized
Habilite a otimização de rota para o servidor endpoint.
--timeout duration
tempo máximo para atingir o estado NOT_UPDATING (default 20m0s)
excluir ponto de extremidade de serviço do databricks
Excluir uma porção endpoint.
databricks serving-endpoints delete NAME [flags]
Argumentos
NAME
O nome do e endpoint e de serviço a ser excluído.
Opções
databricks serving-endpoint export-métricas
Recupera as métricas associadas ao endpoint de serviço fornecido no formato de exposição Prometheus ou OpenMetrics.
databricks serving-endpoints export-metrics NAME [flags]
Argumentos
NAME
O nome do servidor endpoint para recuperar métricas. Esse campo é obrigatório.
Opções
databricks serving-endpoint obter
Recuperar os detalhes de um único endpoint de serviço.
databricks serving-endpoints get NAME [flags]
Argumentos
NAME
O nome do servidor endpoint. Esse campo é obrigatório.
Opções
databricks serving-endpoint obter-open-api
Obtenha o esquema de consulta do servidor de recursos ( endpoint ) no formato OpenAPI. O esquema contém informações sobre os caminhos suportados, formatos de entrada e saída e tipos de dados.
databricks serving-endpoints get-open-api NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Esse campo é obrigatório.
Opções
Lista de pontos finais de serviço do Databricks
Obter todos os pontos finais de serviço.
databricks serving-endpoints list [flags]
Argumentos
Nenhuma
Opções
ponto de extremidade de serviço do databricks logs
Recuperar o serviço logs associado ao modelo servido fornecido.
databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Esse campo é obrigatório.
SERVED_MODEL_NAME
O nome do modelo servido que será recuperado para logs. Esse campo é obrigatório.
Opções
Patch do ponto de extremidade de serviço do Databricks
Adicionar ou excluir tags de uma porção endpoint.
databricks serving-endpoints patch NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço cujas tags serão corrigidas. Esse campo é obrigatório.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
databricks serving-endpoint colocar
Atualize os limites de taxa de atualização de um endpoint de serviço.
Obsoleto: utilize o AI Gateway para gerenciar limites de taxa.
databricks serving-endpoints put NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço cujos limites de taxa estão sendo atualizados. Esse campo é obrigatório.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
databricks serving-endpoint colocar-AI-gateway
Atualize o Gateway AI de um servidor endpoint. Modelo externo, provisionamento, taxa de transferência e endpoint de pagamento por token são totalmente suportados; o endpoint do agente atualmente suporta apenas tabelas de inferência.
databricks serving-endpoints put-ai-gateway NAME [flags]
Argumentos
NAME
O nome do servidor endpoint cujo Gateway AI está sendo atualizado. Esse campo é obrigatório.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
databricks serving-endpoint consulta
Consulte um servidor endpoint.
databricks serving-endpoints query NAME [flags]
Argumentos
NAME
O nome do servidor endpoint. Esse campo é obrigatório.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
--max-tokens int
O campo “ tokens ” (máximo de completions ) é utilizado exclusivamente para completions e chat externo & foundation model serving endpoint.
--n int
O campo n (número de candidatos) é utilizado exclusivamente para preenchimentos e chat externo & foundation model serving endpoint.
--stream
O campo transmissão é utilizado exclusivamente para conclusões e chat externo ao modelo básico & que serve como ponto final.
--temperature float
O campo de temperatura utilizado exclusivamente para conclusões e chat externo ao modelo básico & que serve como ponto final.
databricks serving-endpoint atualizar-configuração
Atualize qualquer combinação do servidor de recursos ( endpoint) das entidades servidas, a configuração de recursos ( compute ) dessas entidades servidas e a configuração de tráfego ( endpoint). Um endpoint que já possui uma atualização em andamento não pode ser atualizado até que a atualização atual seja concluída ou falhe.
databricks serving-endpoints update-config NAME [flags]
Argumentos
NAME
O nome do endpoint de serviço a ser atualizado. Esse campo é obrigatório.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
--no-wait
não espere para atingir o estado NOT_UPDING
--timeout duration
tempo máximo para atingir o estado NOT_UPDATING (default 20m0s)
databricks serving-endpoint obter-níveis-de-permissão
Obtenha os níveis de permissão de um servidor endpoint.
databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]
Argumentos
SERVING_ENDPOINT_ID
O servidor endpoint para o qual obter ou gerenciar permissões.
Opções
databricks endpoint de serviço obter permissões
Obtenha permissões de endpoint de serviço.
Obtém as permissões de um servidor endpoint. O ponto de extremidade de serviço pode herdar permissões do seu objeto raiz.
databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]
Argumentos
SERVING_ENDPOINT_ID
O servidor endpoint para o qual obter ou gerenciar permissões.
Opções
databricks serving-endpoint definir permissões
Defina permissões de e endpoint e de serviço.
databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]
Argumentos
SERVING_ENDPOINT_ID
O servidor endpoint para o qual obter ou gerenciar permissões.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
databricks serving-endpoint atualizar-permissões
Atualize as permissões em um servidor endpoint. O endpoint de serviço pode herdar permissões do seu objeto raiz.
databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]
Argumentos
SERVING_ENDPOINT_ID
O servidor endpoint para o qual obter ou gerenciar permissões.
Opções
--json JSON
As cadeias de caracteres JSON ou o caminho @path para o arquivo JSON com o corpo da solicitação.
Bandeiras globais
--debug
Se deve habilitar o registro de depuração.
-h
ou --help
Exibir ajuda para o comando Databricks CLI ou para o grupo de comandos relacionado ou para o comando relacionado.
--log-file
string
Uma string que representa o arquivo no qual a saída logs deve ser gravada. Se este sinalizador não for especificado, o default deverá gravar a saída logs no stderr.
--log-format
Formato
O tipo de formato do log, text
ou json
. O valor de default é text
.
--log-level
string
Uma string que representa o nível de formato do log. Se não for especificado, o nível de formato do log será desativado.
-o, --output
Tipo
O tipo de saída do comando, text
ou json
. O valor de default é text
.
-p, --profile
string
O nome do perfil no arquivo ~/.databrickscfg
a ser utilizado para executar o comando. Se esse sinalizador não for especificado, se existir, o perfil chamado DEFAULT
será usado.
--progress-format
Formato
O formato para exibir o progresso logs: default
, append
, inplace
ou json
-t, --target
string
Se aplicável, o destino do pacote a ser usado