Pular para o conteúdo principal

Conceitos do Genie Spaces

Genie Spaces é um recurso do Databricks que permite que equipes de negócios interajam com seus dados usando linguagem natural. Especialistas do domínio configuram espaços do Genie com datasets, consultas de amostra e diretrizes de texto para ajudar o Genie a traduzir perguntas de negócios em consultas analíticas. Após a configuração, os usuários corporativos podem fazer perguntas e gerar visualizações para entender os dados operacionais. Para obter informações adicionais sobre os recursos com tecnologia de AI da Databricks, consulte Recursos de Assistência de IA da Databricks.

O Genie seleciona nomes e descrições relevantes de tabelas e colunas anotadas para converter perguntas em linguagem natural em uma consulta SQL equivalente. Ele responde com a consulta gerada e a tabela de resultados, se possível. Se o Genie não conseguir gerar uma resposta, ele pode fazer perguntas de acompanhamento para esclarecer antes de fornecer uma resposta.

Exemplo de caso de uso

Um gerente de vendas deseja entender o produto mais vendido ao longo do tempo em sua padaria. Eles podem interagir com o espaço Genie com linguagem natural e gerar automaticamente uma visualização.

O gif a seguir mostra essa interação:

Gif com amostra de pergunta, resposta e prévia gerada automaticamente

Como o Genie Spaces funciona

Os Espaços Genie usam um sistema composto de IA para interpretar questões comerciais e gerar respostas. Em vez de usar um único grande modelo de linguagem, sistemas compostos de AI processam tarefas em aplicações de AI, combinando vários componentes que interagem entre si. Sistemas de IA compostos são um padrão de design cada vez mais comum para aplicativos de IA devido ao seu desempenho e flexibilidade. Para obter mais informações, consulte A Mudança de Modelos para Sistemas de IA Compostos.

Conceitos fundamentais

Conceito

Descrição

Knowledge Store

Um conjunto de definições semânticas curadas que aprimora o entendimento do Genie dos seus dados. O repositório de conhecimento inclui descrições de tabelas e colunas em nível de espaço, sinônimos, relações de join, expressões SQL e configurações de correspondência de prompt. Configurações do armazenamento de conhecimento são limitadas ao espaço e não afetam os metadados do Unity Catalog. Veja Construir um armazenamento de conhecimento.

Instruções

Notas de texto simples que dizem ao Genie como interpretar seus dados e responder a perguntas. Instruções podem descrever regras de negócios, terminologia preferencial, formatos de data e outros contextos específicos do domínio. Consulte Apresentar instruções.

Exemplos de queries SQL

Consultas SQL que servem como respostas de referência para perguntas comuns. O Genie seleciona inteligentemente exemplos relevantes da biblioteca de queries do espaço para gerar respostas mais precisas. Quando uma resposta é gerada a partir do texto exato de uma consulta de exemplo parametrizada ou função SQL, o Genie a marca como Confiável . Consulte Adicionar exemplos de queries e funções SQL.

Ativos confiáveis

Consultas de exemplo parametrizadas e funções SQL cuja lógica exata foi verificada por um autor do espaço. Quando o Genie usa um ativo confiável para gerar uma resposta, ele exibe um selo **Confiável** para indicar que o resultado vem de uma consulta verificada. Consulte Revisar uma resposta.

Benchmarks

Um conjunto de perguntas de teste usadas para avaliar e medir a precisão das respostas do Genie space. Ao contrário das instruções, benchmarks são apenas para avaliação; Genie não utiliza perguntas de benchmark ou SQL para melhorar seu contexto. Consulte Benchmarks.

Modo Agente

Um modo de raciocínio de múltiplas etapas que realiza uma análise mais profunda em seus dados. O modo de agente divide perguntas complexas em subtarefas, executa múltiplas consultas SQL e retorna um relatório estruturado com descobertas e visualizações. Consulte o modo agente em Genie Spaces.

Quais dados posso usar?

Um Genie Space é baseado em dados registrados no Unity Catalog, incluindo tabelas gerenciadas, tabelas externas, tabelas estrangeiras, views, views de métricas e views materializadas. O Genie utiliza os metadados anexados aos objetos do Unity Catalog, bem como um repositório de conhecimento em nível de espaço com curadoria de autor, para gerar respostas. Datasets bem anotados, acompanhados de instruções específicas fornecidas, são importantes para criar uma experiência positiva para os usuários finais.

nota

O Genie só funciona com dados estruturados . Não pode responder a perguntas sobre dados não estruturados, como PDFs, documentos do Word ou outro conteúdo baseado em arquivo. Para dar ao Genie acesso a documentos não estruturados, use o Chat no Genie, que pode se conectar a fontes de documentos externas como Google Drive ou SharePoint.

Como o Genie Spaces gera uma resposta

Quando um usuário envia uma pergunta, o Genie analisa a solicitação, identifica fontes de dados relevantes e determina como gerar uma resposta apropriada. Detalhes fornecidos pelos autores, combinados com comentários relevantes do Unity Catalog, metadados e valores de amostra de colunas selecionadas, permitem ao Genie inferir tanto a lógica de negócios quanto a técnica. Genie filtra inteligentemente queries SQL de exemplo, metadados de tabela e coluna e histórico de chat para selecionar o contexto mais relevante para responder à solicitação.

O Genie gera respostas utilizando os seguintes componentes:

Componente

Descrição

Metadados de tabela do Unity Catalog

Nomes de tabelas, descrições e relacionamentos definidos de chave primária (PK) e chave estrangeira (FK). O Genie utiliza esses dados para converter solicitações de linguagem natural em SQL.

Nomes e descrições da coluna

O Genie filtra inteligentemente nomes e descrições de colunas relevantes.

Contexto de Knowledge Store

Metadados específicos do espaço que os autores adicionam localmente, incluindo valores de coluna relevantes para a geração de consultas. Não altera os metadados existentes do Unity Catalog. Veja Construir um armazenamento de conhecimento.

Exemplos de queries SQL

Genie seleciona inteligentemente exemplos relevantes de queries SQL.

Funções SQL

Todas as funções SQL que foram adicionadas ao espaço.

Instruções

Notas de texto simples fornecidas como **Instruções gerais**.

Histórico de instruções e respostas

Prompts e respostas do chat atual. Se necessário, devido aos limites de tokens definidos, as partes mais antigas do registro do chat são excluídas.

nota

Alguns detalhes da tabela, como o proprietário e o tamanho da tabela, não estão incluídos por default. Para acessar esta informação, use as views do esquema de informação disponíveis para todos os catálogos do Unity Catalog. Para obter mais informações sobre o que está disponível no esquema de informações, consulte Esquema de informações.

Na maioria dos casos, o Genie gera uma consulta SQL que é executada no SQL warehouse do espaço. As consultas geradas sempre permitem somente leitura. As tentativas são tratadas automaticamente, e o SQL warehouse gerencia a concorrência e a escala. Para obter detalhes sobre como a Genie mantém a segurança e a privacidade, consulte Confiança e segurança do recurso de IA da Databricks.

Melhore a precisão da resposta usando o Inspect

info

Visualização

Esse recurso está em Prévia Pública.

O recurso Inspecionar utiliza raciocínio avançado para revisar e aprimorar a precisão das queries SQL geradas pelo Genie. Ao ativar a Inspeção para uma resposta, o Genie:

  1. Revisa a consulta SQL gerada inicialmente.

  2. Cria instruções SQL menores para verificar aspectos específicos da consulta, tais como:

    • Verificar se os valores de filtro corretos estão incluídos.
    • Validação da lógica de intervalo de datas, como janelas móveis de 7 dias.
    • Verificando condições de join e agregações
  3. Identifica lacunas ou possíveis problemas na consulta original.

  4. Se forem identificados problemas, é gerada uma Query SQL aprimorada que os resolve.

  5. Realiza uma comparação final entre as consultas originais e aprimoradas.

  6. Retorna a query que responde com mais precisão à sua pergunta.

Use o Inspect quando desejar mais confiança na precisão da consulta, especialmente para consultas complexas que envolvam filtros, intervalos de datas ou várias tabelas.

Suporte a idiomas

É possível usar os espaços Genie em idiomas diferentes do inglês, como português e francês. No entanto, o Agent Framework subjacente envolve prompts em inglês.

A Databricks recomenda que os criadores de espaço adicionem o máximo de metadados possível no idioma de sua escolha. As respostas do Genie podem, às vezes, aparecer em inglês devido aos prompts do sistema subjacente.

Como funciona o acesso a dados

O acesso a dados em um Espaço Genie é regido pelo Unity Catalog. Quando um usuário faz uma pergunta, a consulta SQL gerada é executada nos dados usando as credenciais de compute incorporadas pelo autor do espaço (o SQL warehouse configurado). As permissões de dados do Unity Catalog de cada usuário são aplicadas aos resultados da query. Usuários apenas visualizam os dados que estão autorizados a acessar. Qualquer pergunta sobre dados que não podem ser acessados gera uma resposta vazia.

Isso significa:

  • Não é necessário conceder permissões diretas de warehouse aos usuários.
  • Filtros de linha e máscaras de coluna definidos no Unity Catalog são aplicados automaticamente por usuário.
  • Para implementar a filtragem de dados por usuário, aplicar segurança em nível de linha às tabelas subjacentes no Unity Catalog. Consulte Filtros de linhas e máscaras de colunas.

Para obter informações sobre como configurar as permissões de usuário para um espaço do Genie, consulte Compartilhe um espaço Genie. Para Perguntas Frequentes sobre privacidade e segurança, consulte Perguntas Frequentes sobre privacidade e segurança.

Passos seguintes