o passo 1. clonar o repositório de código e criar compute

fluxo de trabalho de desenvolvimento orientado por avaliação

Consulte o repositório do GitHub para obter o código de amostra nesta seção.

Siga estes passos para carregar o código de amostra no site Databricks workspace e definir as configurações globais do aplicativo.

Requisitos

  • Um Databricks workspace com serverless compute e Unity Catalog ativados.

  • Uma pesquisa de vetor existente Mosaic AI Vector Search endpoint ou permissões para criar um novo Vector Search endpoint (a configuração Notebook cria um para o senhor nesse caso).

  • Acesso de gravação a um esquema Unity Catalog existente em que são armazenadas as tabelas de saída Delta que incluem os documentos analisados e divididos em partes e os índices do Vector Search, ou permissões para criar um novo catálogo e esquema (a configuração Notebook cria um para o senhor nesse caso).

  • Um usuário único cluster executando o DBR 14.3 ou acima e que tenha acesso à Internet. É necessário ter acesso à Internet para acessar download o pacote necessário de Python e do sistema. Não use um cluster executando Databricks Runtime para Machine Learning, pois esse tutorial tem Python pacote de conflitos com Databricks Runtime ML.

Instruções

  1. Clone esse repositório em seu site workspace usando as pastasGit .

    vídeo sobre como criar uma pasta git
  2. Abra o rag_app_sample_code/00_global_config Notebook e ajuste as configurações nele.

    # The name of the RAG application.  This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # Unity Catalog catalog and schema where outputs tables and indexes are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## Name of model in Unity Catalog where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. Abra e execute o arquivo 01_validate_config_and_create_resources Notebook.

Próximo passo

Continuar com o POC implantado.