Pular para o conteúdo principal

Crie um armazenamento de conhecimento para ser mais confiável Genie spaces

O repositório de conhecimento Genie permite que você organize e aprimore seu espaço por meio de metadados localizados, correspondência de prompts e instruções SQL estruturadas. Esses recursos ajudam Genie a entender seus dados e a gerar respostas mais precisas e relevantes.

O que é uma loja de conhecimento?

Um armazenamento de conhecimento é uma coleção de definições semânticas selecionadas que aprimora a compreensão dos dados pelo Genie e melhora a precisão das respostas.

O repositório de conhecimento consiste em:

  • Personalização de metadados em nível de espaço : descrições específicas para tabelas, colunas, termos comerciais e sinônimos.
  • Personalização de dados em nível espacial : Conjunto de dados simplificado e focado, sem alterar as tabelas subjacentes Unity Catalog .
  • Correspondência de prompts : Exemplos que ajudam o Genie a encontrar os valores mais relevantes para a pergunta do usuário e a corrigir erros de ortografia nos prompts do usuário. Isso inclui assistência de formatação e correspondência de entidades.
  • relações de junção : relações de tabela definidas para declarações JOIN precisas.
  • Expressões SQL : Definições estruturadas de medidas, filtros e dimensões que capturam a lógica de negócios.

Todas as configurações do armazenamento de conhecimento têm como escopo o seu espaço Genie e não afetam os metadados Unity Catalog ou outros ativos Databricks.

gerenciar metadados do armazenamento de conhecimento

Ensine o Genie sobre os dados em seu espaço, fornecendo descrições locais de tabelas e colunas e adicionando sinônimos de colunas que se alinham com termos comerciais comuns. Simplifique o conjunto de dados ocultando colunas desnecessárias ou duplicadas para manter o foco no site Genie.

Essas práticas melhoram a usabilidade para usuários que não têm permissões diretas nas tabelas subjacentes e também oferecem suporte a iterações mais rápidas ao atualizar versões de instruções.

Para acessar os metadados em nível de espaço, clique em Configure > Data (Configurar Dados ) em seu espaço Genie. Em seguida, clique no nome de uma tabela para acessar view seus metadados e colunas.

colunas de visualização

Clique no nome de uma tabela para ter uma visão geral dos nomes e detalhes das colunas. O exemplo a seguir mostra uma amostra de uma tabela chamada accounts.

Visão geral da tabela mostrando a descrição dos metadados e os detalhes da coluna, conforme descrito abaixo.

  • Descrição: O Genie usa metadados para entender seus dados e gerar respostas precisas. A descrição default da tabela mostra os metadados Unity Catalog associados aos seus dados ativos. Edite esta descrição para adicionar instruções específicas que ajudem o Genie a criar SQL para o seu espaço. Clique em Reset para restaurar a descrição Unity Catalog .

  • Colunas: Os nomes e descrições das colunas estão incluídos na lista de colunas. Cada coluna é rotulada com tags que indicam se ela inclui assistência de formatação ou correspondência de entidades . Consulte a Visão geral da correspondência de prompts.

Ocultar ou mostrar colunas relevantes

As colunas podem ser gerenciadas individualmente ou em massa. Use as instruções a seguir para ocultar ou mostrar colunas.

  • Ocultar uma única coluna : clique ao Ícone de olho lado do nome da coluna.

  • Oculte várias colunas :

    • Marque as caixas de seleção das colunas que você deseja ocultar.
    • No menu Ações , selecione Ocultar colunas selecionadas .
  • Desfazer alterações : Repita os mesmos passos para mostrar uma coluna que estava oculta.

Editar metadados da coluna

Você pode personalizar o seguinte para cada coluna:

  • Descrição : Descrições de colunas específicas do espaço que melhoram a compreensão do Genie.
  • Sinônimos : termos comerciais e palavras-chave que ajudam a combinar o idioma do usuário com os nomes das colunas.
  • Configurações avançadas : controles de correspondência de prompts.
    • Auxílio de formatação : Ative ou desative a amostragem de valores representativos.
    • Correspondência de entidades : Ative ou desative a correspondência de entidades para colunas categóricas.

Para editar os metadados da coluna:

  1. Clique no Ícone de lápis. Ícone de lápis ao lado do nome da coluna.
  2. Edite a descrição e os sinônimos da coluna.
  3. Se necessário, clique em Configurações avançadas para abrir os controles de correspondência de prompts.
  4. Clique em Salvar para manter suas alterações e fechar a caixa de diálogo.

Visão geral de correspondência de prompts

A correspondência de prompts permite que o Genie encontre colunas e valores mais relevantes para a pergunta do usuário e corrija erros de ortografia nos prompts. Isso melhora a precisão do Genie e ajuda a gerar consultas SQL mais confiáveis.

Quando um usuário faz uma pergunta no Genie, a linguagem costuma ser coloquial e pode incluir erros como erros de ortografia. Nesses casos, os valores no prompt podem não corresponder à estrutura ou aos valores nos dados. Isso pode fazer com que o Genie interprete a pergunta incorretamente e gere um SQL incorreto.

Exemplo

Analise o seguinte exemplo:

"Mostre-me as vendas de carros na Flórida para o primeiro trimestre."

Se o uso de dados indicar abreviações (como FL), e Genie não conseguir acessar os valores dessa coluna, Genie poderá gerar SQL que inclua ILIKE '%Florida%', que não retorna resultados.

Habilitar a correspondência de entidades na coluna state permite que o Genie acesse valores representativos. Com este contexto, o Genie pode reconhecer que FL corresponde a "Flórida" e gerar SQL mais preciso.

Sem correspondência de entidades

Com correspondência de entidades

WHERE state ILIKE '%Florida%'

WHERE state = 'FL'

componentes de correspondência de prompts

  • Assistência de formatação : A assistência de formatação fornece valores representativos para todas as colunas elegíveis, ajudando o Genie a entender os tipos de dados e os padrões de formatação. Os valores representativos para a correspondência de prompts são gerados usando as permissões de dados do autor. Esses valores passam a fazer parte do contexto compartilhado do espaço e ajudam o Genie a interpretar as solicitações do usuário com mais precisão para todos os participantes do espaço.
  • Correspondência de entidades : A correspondência de entidades fornece listas selecionadas de valores distintos para até 120 colunas onde os usuários provavelmente farão referência a entradas específicas, como estados e categorias de produtos. Isso ajuda o Genie a associar a terminologia do usuário aos valores reais dos dados. Cada coluna pode incluir até 1.024 valores distintos, cada um com até 127 caracteres de comprimento. Os dados de correspondência de entidades são armazenados no bucket de armazenamento do seu workspace.

O Genie fornece automaticamente assistência de formatação e correspondência de entidades para colunas elegíveis à medida que você adiciona tabelas ao espaço. Tabelas com filtros de linha ou máscaras de coluna são excluídas da correspondência de prompts.

® correspondência de prompts

Controle quais colunas fornecem assistência de formatação e correspondência de entidades para otimizar a compreensão dos seus dados pelo Genie. A correspondência de prompts está ativada por default para todos Genie spaces.

· assistência de formatação

A assistência de formatação é aplicada automaticamente quando você adiciona tabelas a um espaço Genie.

Para desativar a assistência de formatação para uma coluna:

  1. Clique em Configure > Data em seu espaço Genie.
  2. Clique no nome de uma tabela para acessar view suas colunas.
  3. Clique no Ícone de lápis. Ícone de lápis ao lado do nome da coluna.
  4. Clique em Avançado .
  5. Desative a assistência de formatação .

Essa ação também desativa automaticamente a correspondência de entidades para essa coluna. Se necessário, use esta configuração para reativar a assistência de formatação .

Configurar correspondência de entidades

O Genie gera respostas usando sua solicitação, metadados relevantes da tabela, recursos de correspondência de solicitações, sinais de erro e qualquer código ou consulta de entrada. Quando uma coluna tem a correspondência de entidades ativada, o Genie utiliza os valores armazenados para corresponder com mais precisão às solicitações do usuário aos dados reais. Isso produz consultas SQL mais confiáveis. A correspondência de entidades melhora significativamente a precisão do Genie, especialmente quando combinada com exemplos de consultas claros e instruções bem elaboradas. Consulte a seção "Como organizar um espaço Genie eficaz" para obter mais orientações.

O Genie impede que você habilite a correspondência de entidades em tabelas com filtros de linha ou máscaras de coluna. No entanto, os autores do espaço devem desativar a correspondência de entidades para visualizações que fazem referência a tabelas com filtros de linha ou máscaras de coluna, ou para visualizações dinâmicas.

A lista a seguir inclui exemplos dos tipos de dados que funcionam bem com a correspondência de entidades:

  • Códigos de estado ou país
  • categorias de produtos
  • Códigos de status
  • Nomes de departamentos

Para ativar a correspondência de entidades, a assistência de formatação deve estar ativada. Em seguida, siga os passos abaixo:

  1. Clique em Configure > Data em seu espaço Genie.
  2. Clique no nome de uma tabela para acessar view suas colunas.
  3. Clique no Ícone de lápis. Ícone de lápis ao lado do nome da coluna.
  4. Clique em Avançado .
  5. Ative a correspondência de entidades .
  6. Para desativar a correspondência de entidades para uma coluna, desative a opção "Correspondência de entidades" .

Uma coluna de cadeias de caracteres com o botão do dicionário de valores à direita.

Atualizar ou remover dados correspondentes de prompt

A atualização dos dados correspondentes ao prompt atualiza os valores armazenados em uma coluna. Atualizar valores se:

  • Novos valores foram adicionados à coluna.
  • O formato dos valores existentes foi alterado.

Para refresh os dados de correspondência de prompts, clique Ícone do menu Kebab. o menu de kebab na view em coluna, depois atualize o prompt correspondente .

Atualizar valores ou remover opções de valores na interface do usuário

Definir relacionamentos join

Ajude o Genie a criar declarações precisas no site JOIN, definindo as relações entre as tabelas:

  1. Clique em participar .

  2. Clique em Adicionar .

  3. Selecione tabelas à esquerda e à direita nos menus suspensos.

  4. Insira uma condição de união (por exemplo, accounts.id = opportunity.accountid)

    • Para condições join mais complexas, clique em Usar expressão SQL e, em seguida, registre a condição join como uma expressão SQL .
  5. Selecione um tipo de relacionamento :

    • Muitos para um : várias linhas à esquerda são mapeadas para uma linha à direita
    • Um para muitos : uma linha à esquerda é mapeada para várias linhas à direita
    • Um para um: uma linha à esquerda é mapeada para no máximo uma linha à direita

Instruções de união mostrando um relacionamento identificado join

nota

Quando existem várias uniões entre as mesmas tabelas ou são usadas uniões automáticas, o site Genie gera automaticamente aliases para a tabela da direita para evitar ambiguidade.

Obtenha sugestões a partir do feedback.

Quando os usuários clicam no ícone de "curtir" em uma mensagem que une tabelas ou usa expressões SQL , Genie analisa a resposta e pode sugerir novos trechos SQL (como medidas, junções ou filtros) para que os autores do espaço revisem e adicionem ao repositório de conhecimento. O Genie não aprende ou altera seu comportamento automaticamente com base no feedback.

Defina expressões SQL

Interface de expressões SQL mostrando medidas, filtros e dimensões

As expressões SQL fornecem uma maneira estruturada e guiada de ensinar o Genie sobre termos comerciais comuns, como KPIs, atributos e condições. A Genie utiliza essas definições quando um usuário pergunta sobre esses termos comerciais.

As expressões SQL complementam os exemplos de consultas SQL, especificados nas instruções. Expressões SQL definem conceitos de negócios reutilizáveis, mas exemplos de consultas SQL são mais úteis para ensinar o Genie a abordar formatos comuns de solicitações do usuário. Por exemplo, se os usuários costumam pedir "uma análise detalhada do desempenho", uma consulta SQL de exemplo pode mostrar que isso significa vendas fechadas por região, representante de vendas e gerente.

As expressões SQL funcionam melhor quando você precisa:

  • Fornecer definições estruturadas para KPIs e métricas, como margem de lucro ou taxa de conversão
  • Dê ao Genie um contexto explícito sobre como calcular valores importantes
  • Defina dimensões adicionais para o dataset, como mês ou segmento de cliente
  • Ensine filtros Genie para condições comerciais, como pedidos grandes ou pedidos antes de um horário específico

Tipos de expressão SQL

Você pode definir os seguintes tipos de expressões SQL:

  • Medidas : indicadores-chave de desempenho (KPIs) e métricas. Defina o nome, cálculo SQL e sinônimos.
  • Filtros : Condições comuns de filtragem. Defina o nome, a lógica do filtro SQL e sinônimos.
  • Dimensões : Atributos para agrupar e analisar dados. Defina o nome, a expressão SQL e sinônimos.

Use as seguintes instruções para definir expressões SQL:

  1. Clique em Configurar > Instruções > Expressões SQL
  2. Clique em Adicionar . Escolha Filtro , Medida ou Dimensão .
  3. No campo Nome , insira um nome para a expressão.
  4. No campo Código , insira a expressão SQL.
  • As expressões de filtro devem ser avaliadas como uma condição booleana.
  • As expressões de medida devem calcular uma agregação em várias linhas na tabela.
  • As expressões de dimensão devem alterar o valor de cada linha dos dados existentes.
  1. No campo Sinônimos , insira formas comuns pelas quais os usuários podem se referir às expressões coloquialmente.
  2. No campo Instruções , insira instruções específicas que informam ao Genie para que serve a expressão e como trabalhar com ela.

Next os passos

Use os links a seguir para ajudá-lo a continuar a construir seu espaço Genie.