Solução de problemas Genie spaces
Esta página descreve como resolver problemas comuns ao criar e manter Genie spaces.
Jargão empresarial mal interpretado
A maioria das empresas ou domínios possui uma linguagem abreviada específica que utiliza para comunicar eventos relacionados aos seus negócios. Por exemplo, ao se referir a um ano, pode sempre estar se referindo ao ano fiscal, e esse ano fiscal pode começar em fevereiro ou março, em vez de janeiro. Para permitir que o Genie responda a essas perguntas de forma natural e precisa, inclua instruções que mapeiem explicitamente o jargão da sua empresa para palavras e conceitos que o Genie possa entender. Consulte a seção Fornecer instruções.
Uso incorreto de tabela ou coluna
Se Genie estiver tentando extrair dados de uma tabela incorreta ou executar análises em colunas incorretas, você pode ajustar os dados de uma das seguintes maneiras:
- Forneça descrições claras e precisas : verifique suas tabelas e metadados associados para confirmar se a terminologia utilizada corresponde à terminologia dos usuários nas perguntas enviadas. Caso contrário, refine a descrição ou adicione uma instrução que mapeie a terminologia usada na tabela para a terminologia usada na pergunta.
- Adicionar consultas de exemplo : Forneça exemplos de consultas SQL que o Genie possa usar para aprender a responder a determinadas perguntas. Consulte a seção Fornecer instruções.
- Remova tabelas ou colunas do espaço : Algumas tabelas podem incluir colunas ou conceitos sobrepostos que dificultam ao Genie saber quais dados usar em uma resposta. Se possível, remova tabelas ou colunas desnecessárias ou sobrepostas. Para ocultar colunas da interface do usuário do Genie Space sem alterar os objetos de dados subjacentes, consulte Ocultar ou exibir colunas relevantes.
Erros de filtragem
As consultas geradas geralmente incluem uma cláusula WHERE para filtrar os resultados de acordo com um valor específico. Quando o Genie não tem visibilidade dos valores dos dados, ele pode definir a cláusula WHERE para filtrar o valor errado. Por exemplo, pode tentar encontrar uma correspondência com o nome "California" quando a tabela usa abreviações como "CA".
Em situações como essa, verifique se as colunas relevantes têm os dicionários de valores de exemplo e de valores ativados. Se novos dados foram adicionados às tabelas relevantes, refresh os valores. Consulte Criar um repositório de conhecimento para obter Genie spacesmais confiáveis.
Junção incorreta
Se as referências key estrangeira não estiverem definidas no Unity Catalog, seu espaço pode não saber como join tabelas diferentes.
Tente implementar uma ou mais das seguintes soluções:
- Defina as referências key estrangeira no seu Unity Catalog sempre que possível. Consulte a cláusula CONSTRAINT.
- Se as relações key estrangeira das suas tabelas não estiverem especificadas no Unity Catalog, defina as relações join no repositório de conhecimento do seu espaço Genie . Essa estratégia é útil para cenários join mais complexos, como a autojunção, ou se você não tiver permissão suficiente para modificar as tabelas subjacentes. Consulte Definir relações join.
- Forneça exemplos de consultas onde você join tabelas de maneiras padrão.
Se nenhuma dessas soluções resolver o problema, pré-join a tabela em uma view e use-a como entrada para o espaço.
Os comentários das colunas não estão sendo sincronizados com tabelas externas.
Databricks não gerencia os metadados, os dados ou a semântica das gravações em tabelas externas. Dependendo da tabela de origem, os comentários podem não estar acessíveis no Databricks. Para disponibilizar os comentários, a Databricks recomenda fazer um dos seguintes procedimentos:
- Edite os metadados da coluna na interface do usuário do Genie Space. Os metadados editados aplicam-se apenas ao espaço Genie onde foram gravados. Consulte Editar metadados da coluna.
- Criar uma visão materializada sobre tabelas federadas. Você pode adicionar e editar comentários em uma view materializada da mesma forma que faria em uma tabela materializada. Você pode reutilizar essa view em vários Genie spaces. Para obter detalhes sobre como carregar dados de tabelas externas para uma view materializada, consulte Carregar dados de tabelas externas com visão materializada. Para saber mais sobre como trabalhar com visualizações materializadas, consulte Visualização materializada.
problemas de cálculo de métricas
A forma como as métricas são calculadas e consolidadas pode ser arbitrariamente complexa e abranger muitos detalhes de negócios que sua área de atuação desconhece. Isso pode levar a relatórios incorretos.
Tente implementar uma ou mais das seguintes soluções:
- Se suas métricas forem agregadas a partir de tabelas base, forneça exemplos de consultas SQL que calculem cada valor de agregação.
- Se as suas métricas foram pré-computadas e estão em tabelas agregadas, explique isso nos comentários da tabela. Especifique as agregações válidas para cada medida, caso as medidas nessa tabela possam ser ainda mais consolidadas.
- Se o SQL que você está tentando gerar for muito complexo, tente criar visualizações que já tenham agregado seus métricas para o seu espaço.
Cálculos de tempo incorretos
O Genie pode nem sempre conseguir inferir o fuso horário representado nos dados ou o fuso horário em que sua análise precisa ser realizada, a menos que você forneça orientações adicionais explicitamente.
Inclua instruções mais explícitas detalhando o fuso horário de origem, a função de conversão e o fuso horário de destino. Os exemplos a seguir mostram como alterar as instruções gerais para conversões de fuso horário mais confiáveis:
-
Sempre converta os horários para um fuso horário específico : Neste exemplo, suponha que o carimbo de data/hora de origem seja
UTCe você queira resultados no fuso horárioAmerica/Los_Angeles. Adicione o seguinte às instruções, substituindo<timezone-column>pelo nome da coluna apropriada:- Os fusos horários nas tabelas estão em
UTC. - Converta todos os fusos horários usando a seguinte função:
convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
- Os fusos horários nas tabelas estão em
-
Converter formatos de data e hora não UTC para UTC : Se o fuso horário default workspace for
UTC, mas os usuários em Los Angeles precisarem consultar a data de hoje para um conjunto específico de registros, adicione o seguinte às instruções gerais do espaço:- Para fazer referência a hoje , use
date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp())).
- Para fazer referência a hoje , use
Consulte a funçãoconvert_timezone para obter mais detalhes e sintaxe.
Ignorando instruções
Mesmo que você tenha explicado suas tabelas e colunas nos comentários e fornecido instruções gerais, seu espaço ainda pode não estar usando-as corretamente.
Experimente uma ou mais das seguintes estratégias:
- Forneça exemplos de consultas que utilizem suas tabelas corretamente. Consultas de exemplo são especialmente eficazes para ensinar sua equipe a usar seus dados.
- Oculte colunas irrelevantes no espaço Genie. Consulte Ocultar ou mostrar colunas relevantes.
- Crie visualizações a partir de suas tabelas que ofereçam uma view mais simples de seus dados.
- Revise suas instruções e tente otimizar o espaço removendo tabelas ou instruções irrelevantes.
- Tente iniciar um novo bate-papo. Interações anteriores podem influenciar as respostas do Genie em qualquer bate-papo, mas iniciar um novo bate-papo oferece um ponto de partida em branco para testar novas instruções.
Problemas de desempenho
Quando o Genie precisa gerar consultas ou respostas de texto excepcionalmente longas, pode demorar muito para responder ou até mesmo expirar o tempo limite durante a fase de processamento.
Experimente uma ou mais das seguintes ações para melhorar o desempenho:
- Utilize ativos ou visualizações confiáveis para encapsular consultas complexas. Consulte Usar ativo confiável em espaços AI/BI Genie spaces.
- Reduza o tamanho das suas consultas SQL de exemplo sempre que possível.
- Inicie um novo chat se Genie começar a gerar respostas lentas ou falhas.
Respostas não confiáveis a perguntas de importância crucial para a missão.
Use ativos confiáveis para fornecer respostas verificadas a perguntas específicas que você espera que os usuários façam. Consulte Usar ativo confiável em espaços AI/BI Genie spaces.
Aviso de limite de tokens
Os tokens são as unidades básicas de texto que o Genie usa para processar e compreender a linguagem. As instruções de texto e os metadados em um espaço Genie são convertidos em tokens. Se o seu espaço estiver próximo do limite de tokens, um aviso será exibido. O Genie usa filtragem contextual para priorizar os tokens que considera mais relevantes para uma pergunta. Embora as respostas ainda devam ser geradas quando um aviso aparecer, a qualidade pode ser reduzida se o contexto importante for filtrado. Quando o limite de tokens for excedido, você não poderá mais enviar ou receber mensagens no espaço Genie.
Considere as seguintes práticas para reduzir a quantidade de tokens:
- Remova colunas desnecessárias : Colunas desnecessárias em suas tabelas podem contribuir significativamente para o consumo de tokens. Sempre que possível, crie visualizações para excluir campos redundantes ou não essenciais de suas tabelas brutas. Você também pode ocultar colunas desnecessárias em um espaço Genie. Consulte Ocultar ou mostrar colunas relevantes.
- Simplifique as descrições das colunas : Embora as descrições das colunas sejam importantes, evite duplicar informações já transmitidas pelos nomes das colunas. Por exemplo, se uma coluna for nomeada
account_name, uma descrição como "o nome da sua account" pode ser redundante e pode ser omitida. - Editar metadados de coluna no espaço Genie : Consulte Editar metadados de coluna para saber como editar descrições e fornecer sinônimos nos metadados da coluna.
- Elimine exemplos de consultas SQL : Inclua uma variedade de exemplos de consultas SQL para abranger diversos tipos de perguntas, mas remova exemplos repetidos ou redundantes.
- Simplifique as instruções : Verifique se suas instruções são claras e concisas. Evite palavras desnecessárias.
Sua account não está habilitada para processamento entre regiões geográficas.
Genie é um serviço de gerenciamento designado pela Databricks. Serviço designado usa Databricks Geos para gerenciar a residência de dados. Para algumas regiões, não é possível processar dados na mesma Geo que o workspace . Se o seu workspace estiver em uma dessas regiões, o processamento entre regiões geográficas precisa ser ativado pelo administrador da sua account .
Atingindo os limites da Taxa de Transferência
Ao acessar Genie spaces por meio da interface do usuário Databricks , a taxa de transferência é limitada a 20 perguntas por minuto por workspace, em todos Genie spaces.
Ao acessar Genie spaces usando o nível gratuito da API de Conversação (Prévia Pública), a taxa de transferência é limitada a cinco perguntas por minuto por workspace, em todos Genie spaces, na medida do possível. Consulte Usar a API do Genie para integrar o Genie em seus aplicativos.