o passo 1. clonar o repositório de código e criar compute

fluxo de trabalho de desenvolvimento orientado por avaliação

Consulte o repositório do GitHub para obter o código de amostra nesta seção. O senhor também pode usar o código do repositório como um padrão para criar seus próprios aplicativos AI.

Siga estes passos para carregar o código de amostra no site Databricks workspace e definir as configurações globais do aplicativo.

Requisitos

  • Um Databricks workspace com serverless compute e Unity Catalog ativados.

  • Uma pesquisa vetorial existente Mosaic AI Vector Search endpoint ou permissões para criar um novo Vector Search endpoint (nesse caso, o Notebook de configuração cria um para o senhor).

  • Acesso de gravação a um esquema Unity Catalog existente em que as tabelas de saída Delta que incluem os documentos analisados e divididos em partes e os índices do Vector Search são armazenados, ou permissões para criar um novo catálogo e esquema (o Notebook de configuração cria um para o senhor nesse caso).

  • Um único usuário cluster executando o DBR 14.3 ou acima que tenha acesso à Internet. É necessário ter acesso à Internet para acessar download o pacote necessário de Python e do sistema. Não use um cluster executando Databricks Runtime para Machine Learning, pois esse tutorial tem Python pacote de conflitos com Databricks Runtime ML.

Diagrama de fluxo do tutorial

O diagrama mostra o fluxo dos passos usados neste tutorial.

fluxo do Notebook usado no tutorial

Instruções

  1. Clone esse repositório em seu site workspace usando as pastasGit .

    vídeo de como criar uma pasta git
  2. Abra o Notebook rag_app_sample_code/00_global_config e ajuste as configurações lá.

    # The name of the RAG application.  This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # Unity Catalog catalog and schema where outputs tables and indexes are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## Name of model in Unity Catalog where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. Abra e execute o Notebook 01_validate_config_and_create_resources.