Configuração de clusters para o RAG Studio

Este artigo descreve os clusters que o RAG Studio provisiona para automatizar a tarefa, incluindo a ingestão de dados, a criação de cadeias RAG e a avaliação RAG.

Em default, o RAG Studio provisionamento novos clusters Job especificamente para essas tarefas.

Provisionamento de clusters padrão

Os default clusters provisionamento do RAG Studio são:

  • Acesso Mode: Atribuído

  • Databricks Runtime Versão: 13.3 LTS ML

Essa configuração é otimizada para estabilidade e desempenho.

Requisitos de permissões

Para permitir que o RAG Studio faça o provisionamento desses clusters automaticamente, certifique-se de que o Databricks account tenha as permissões necessárias para criar clusters Job com as propriedades acima.

Usar um cluster interativo existente

Se preferir usar um cluster interativo existente para a tarefa do RAG Studio, o senhor pode configurar isso especificando o ID do cluster no uso de rag, por exemplo:

./rag create-rag-version -e dev --cluster-id <your-cluster-id>

Para identificar o ID de um cluster, consulte URL e ID de clusters.

Como alternativa, o senhor pode especificar um ID de clusters no arquivo de configuração rag-config.yml. Esse método é útil para definir um default clusters para todas as operações do RAG Studio em um ambiente específico. Adicione o campo cluster_id na seção de ambiente apropriada, conforme mostrado abaixo:

development:
  - name: dev
    ...
    cluster_id: <your_cluster_id>

A substituição de clusters só é compatível com o ambiente dev.