Ambientes

Visualização

Este recurso está na visualização privada. Para experimentar, entre em contato com seu contato do Databricks.

Procurando um documento RAG Studio diferente? Vá para o índice de documentação RAG

Contexto: Fluxo de trabalho de desenvolvimento do RAG

O fluxo de trabalho de desenvolvimento do RAG exige que os usuários interajam com as versões anteriores do aplicativo para fornecer feedback. Sem esse feedback, é difícil iterar e melhorar a qualidade do aplicativo.

Permitir que os usuários interajam com um aplicativo RAG requer que você implante uma infraestrutura, como um aplicativo de bate-papo baseado na Web e o endpoint da API REST correspondente por trás do aplicativo, e permita que essa infraestrutura acesse seus dados de produção. Embora isso possa criar uma linha tênue entre desenvolvimento e produção, é extremamente importante que os desenvolvedores mantenham uma separação clara entre esses ambientes.

Além disso, é ideal que a mesma base de código possa ser usada no desenvolvimento e na produção (por exemplo, sem alterações de código, apenas alterações de configuração). Este é o paradigma padrão no desenvolvimento de aplicativos full stack. Sem uma base de código compartilhada, os desenvolvedores são forçados a manter e sincronizar bases de código separadas – levando ao risco de que o aplicativo apresente distorções online/offline e, na pior das hipóteses, não consiga fornecer respostas de alta qualidade na produção.

Como funcionam os ambientes no RAG Studio

O RAG Studio aborda esse desafio por meio do conceito de Environments.

Environments permitem que você tenha uma única base de código que pode ser implantada pordefault via CI/CD, apenas com alterações de configuração entre dev e prod. Os Environments do RAG Studio são baseados no conceito de alvos do Databricks ativo Bundles.

Para entender como Environments funciona, vamos revisar os componentes de um aplicativo RAG Studio.

Observação

Dica

🚧 roteiro 🚧 O RAG Studio suporta apenas um único workspace para todos os ambientes. O suporte para aplicativos RAG Studio que usam vários espaços de trabalho está em nosso roteiro.

Cada aplicativo RAG vem com 3 ambientes pré-configurados:

  1. Ambiente de usuários finais end_users Usado para tráfego de produção

  2. Ambiente de revisores reviewers Usado para testar versões com usuários finais/revisores especialistas

  3. Ambiente de desenvolvimento dev Usado para o ciclo interno de desenvolvimento, por exemplo, testes e iteração rápida

Opcionalmente, para oferecer suporte a vários desenvolvedores trabalhando no mesmo aplicativo, você pode configurar mais de um ambiente dev .

Categoria

Item

dev

reviewers

end_users

Configuração Global

Databricks Workspace

Compartilhado

Compartilhado

Compartilhado

Pasta workspace para hospedar o código implantado + configuração

Compartilhado

Compartilhado

Compartilhado

Experimento MLflow

Compartilhado

Compartilhado

Compartilhado

Esquema Unity Catalog *

Compartilhado

Compartilhado

Compartilhado

Version

Código + Configuração**

Compartilhado

Compartilhado

Compartilhado

Infraestrutura para execução de uma versão do aplicativo

Vector Search endpoint

Compartilhado

Compartilhado

Compartilhado

🔗 Chain Modelo de ponto de extremidade de serviço

Exclusivo

Exclusivo

Exclusivo

<review-ui> Aplicativo

Exclusivo

Exclusivo

Exclusivo

* Armazena todas as tabelas Delta, índices vetoriais, modelos. As convenções de nomenclatura diferenciam itens entre ambientes (por exemplo, logs_prod vs. logs_dev) ** registros como execução de MLflow e versões de modelo

Configurar ambientes no RAG Studio

Os ambientes são configurados em rag-config.yml - view os documentos de configuração do rag-config.yml para saber como fazer.