Use a amostragem de valores para melhorar a precisão do Genie
Visualização
Esse recurso está em Public Preview.
A amostragem de valores ajuda o Genie a gerar SQL mais preciso, coletando e usando valores de dados reais de suas tabelas. Ele tem dois componentes:
- Valores de exemplo: Pequenas amostras de cada coluna que ajudam o Genie a entender o tipo e a formatação dos dados.
- Dicionários de valores: listas selecionadas dos valores mais relevantes em uma coluna, usadas para combinar as solicitações do usuário com os dados reais.
Visão geral
Quando um usuário faz uma pergunta no Genie, a frase geralmente é coloquial e pode incluir erros, como erros de ortografia. Nesses casos, os valores no prompt podem não corresponder à estrutura ou aos valores nos dados. Isso pode fazer com que o Genie interprete mal a pergunta e gere um SQL incorreto.
Por exemplo, um usuário pode perguntar:
"Mostre-me ventas de carros na Flórida para o Q1."
Se o uso de dados indicar abreviações (como FL
), e Genie não puder acessar os valores dessa coluna, Genie poderá gerar SQL que inclui ILIKE '%Florida%'
, que não retorna nenhum resultado.
A ativação da amostragem de valores na coluna state
permite que o Genie acesse valores representativos. Com esse contexto, o Genie pode reconhecer que FL
corresponde a "Florida" e gerar um SQL mais preciso.
Sem dicionário de valores | Com dicionário de valores |
---|---|
|
|
A amostragem de valores ajuda o Genie a retornar resultados corretos, melhorando sua capacidade de gerar SQL preciso.
Requisitos
- Genie spaces deve ser ativado. Consulte gerenciar Genie access.
- A configuração de visualização de amostragem de dados doGenie é ativada pelo default. Se necessário, um administrador do workspace pode gerenciar o acesso à visualização na página Previews. A visualização deve ser definida como On para que os autores do espaço Genie usem valores de exemplo e dicionários de valores.
Como funciona a amostragem de valor
O Genie armazena automaticamente valores de exemplo e cria dicionários de valores para colunas elegíveis à medida que o senhor adiciona tabelas ao espaço. Tabelas com filtros de linha ou máscaras de coluna são excluídas. A lista de colunas view mostra tags para indicar quais colunas incluem valores de exemplo ou dicionários de valores .
- Valores de exemplo são coletados para todas as colunas elegíveis e ajudam o Genie a entender o tipo e a formatação dos dados
- Os dicionários de valores são criados para até 60 colunas, que devem se concentrar naquelas em que os usuários provavelmente farão referência a valores específicos, como estados e categorias de produtos. Cada dicionário pode incluir até 1.024 valores distintos com menos de 127 caracteres. Se o limite de espaço para dicionários de valores for atingido e você quiser ajustar quais colunas serão incluídas, você poderá selecionar manualmente as colunas. Para obter instruções, consulte gerenciar dicionários de valores. Os dicionários de valores são armazenados no bucket de armazenamento do site workspace.
Gerenciar valores de exemplo
Se a amostragem de valores estiver ativada para o site workspace, os valores de exemplo serão adicionados automaticamente quando o senhor selecionar tabelas ao criar um novo espaço.
Para desativar valores de exemplo para uma coluna:
- Clique em Configure > Data em seu espaço Genie.
- Clique no nome de uma tabela para acessar view suas colunas.
- Clique no ícone de
edição ao lado do nome da coluna.
- Clique em Avançado .
- Desative os valores de exemplo .
Essa ação desativa automaticamente a criação de um dicionário de valores para essa coluna. Se necessário, use essa configuração para ativar novamente os valores de exemplo .
gerenciar dicionários de valores
O Genie gera respostas usando seu prompt, metadados de tabelas relevantes, valores amostrados, sinais de erro e qualquer código ou consulta de entrada. Quando uma coluna tem um dicionário de valores associado, o Genie aproveita os valores armazenados para interpretar melhor as solicitações do usuário e produzir consultas SQL mais precisas. Os dicionários de valores melhoram significativamente a precisão do Genie, especialmente quando combinados com exemplos claros de consultas e instruções bem elaboradas. Consulte Organizar um espaço Genie eficaz para obter mais orientações.
Ao selecionar colunas para dicionários de valores, escolha colunas de cadeias de caracteres que forneçam um contexto útil para a interpretação dos prompts. As colunas com valores categóricos ou formatados de forma consistente, como estados ou categorias de produtos, normalmente funcionam melhor. Evite colunas de texto livre ou não estruturadas, como IDs de usuário, nomes ou avaliações, pois elas geralmente não têm contexto significativo e podem reduzir a precisão.
Para definir quais colunas de cadeias de caracteres incluem um dicionário de valores:
- Clique em Configure > Data em seu espaço Genie.
- Clique no nome de uma tabela para acessar view suas colunas.
- Clique no ícone de
edição ao lado do nome da coluna.
- Clique em Avançado .
- Ative o Build value dictionary .
- Para desativar os dicionários de valores de uma coluna, desative a opção Criar dicionários de valores . Consulte atualizar ou remover valores.
atualizar ou remover valores
A atualização dos valores de amostra atualiza os valores armazenados de uma coluna. Atualizar os valores de amostra se:
- Novos valores foram adicionados à coluna.
- O formato dos valores existentes foi alterado.
Para refresh um dicionário de valores, clique no menu kebab na coluna view e, em seguida, atualize os valores de amostra .