o passo 1. clonar o repositório de código e criar compute

fluxo de trabalho de desenvolvimento orientado por avaliação

Consulte o repositório do GitHub para obter o código de amostra nesta seção.

Siga estes passos para carregar o código de amostra no site Databricks workspace e definir as configurações globais do aplicativo.

Requisitos

  • Um Databricks workspace com serverless compute e Unity Catalog ativados.

  • Uma pesquisa vetorial existente Mosaic AI Vector Search endpoint ou permissões para criar um novo Vector Search endpoint (nesse caso, o Notebook de configuração cria um para o senhor).

  • Acesso de gravação a um esquema Unity Catalog existente em que as tabelas de saída Delta que incluem os documentos analisados e divididos em partes e os índices do Vector Search são armazenados, ou permissões para criar um novo catálogo e esquema (o Notebook de configuração cria um para o senhor nesse caso).

  • Um usuário único cluster executando o DBR 14.3 ou acima e que tenha acesso à Internet. É necessário ter acesso à Internet para acessar download o pacote necessário de Python e do sistema. Não use um cluster executando Databricks Runtime para Machine Learning, pois esse tutorial tem Python pacote de conflitos com Databricks Runtime ML.

Instruções

  1. Clone esse repositório em seu site workspace usando as pastasGit .

    vídeo de como criar uma pasta git
  2. Abra o Notebook rag_app_sample_code/00_global_config e ajuste as configurações lá.

    # The name of the RAG application.  This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # Unity Catalog catalog and schema where outputs tables and indexes are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## Name of model in Unity Catalog where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. Abra e execute o Notebook 01_validate_config_and_create_resources.

Próximo passo

Continuar com o POC implantado.