Pular para o conteúdo principal

Coloque seu agente Databricks Apps em produção.

Depois de criar um agente e implantá-lo no Databricks Apps, coloque-o em produção nesta ordem:

    • 2. Realize um teste de carga no seu agente do Databricks Apps.
    • Determine o QPS máximo que seu agente consegue manter. Executar um teste de carga de rampa até a saturação em uma versão simuladaLLM do seu agente para isolar a taxa de transferência da infraestrutura Databricks Apps da latência do modelo.
    • 3. Governe o uso do LLM com o Unity AI Gateway
    • Encaminhe as chamadas LLM através do Unity AI Gateway. Centralize permissões, atribua custos por aplicativo, swap modelos e inspecione ou reproduza o tráfego sem modificar o código do agente.

Para CI/CD genérico Databricks Apps que não seja específico de um agente, consulte CI/CD para Databricks Apps com GitHub Actions.