Coloque seu agente Databricks Apps em produção.
Depois de criar um agente e implantá-lo no Databricks Apps, coloque-o em produção nesta ordem:
-
- 1. Configure a CI/CD para o seu agente do Databricks Apps.
- Automatize a implantação Databricks Apps a partir do GitHub Actions. Utiliza federação de identidade de carga de trabalho (sem segredos de longa duração) e um fluxo de trabalho inicial fornecido no agente padrão.
-
- 2. Realize um teste de carga no seu agente do Databricks Apps.
- Determine o QPS máximo que seu agente consegue manter. Executar um teste de carga de rampa até a saturação em uma versão simuladaLLM do seu agente para isolar a taxa de transferência da infraestrutura Databricks Apps da latência do modelo.
-
- 3. Governe o uso do LLM com o Unity AI Gateway
- Encaminhe as chamadas LLM através do Unity AI Gateway. Centralize permissões, atribua custos por aplicativo, swap modelos e inspecione ou reproduza o tráfego sem modificar o código do agente.
Para CI/CD genérico Databricks Apps que não seja específico de um agente, consulte CI/CD para Databricks Apps com GitHub Actions.