O que é um espaço AI/BI Genie?

Este artigo apresenta o AI/BI Genie, um recurso do Databricks que permite que as equipes de negócios interajam com o uso de dados em linguagem natural. Ele usa o generativo AI adaptado à terminologia e aos dados da sua organização, com a capacidade de monitorar e refinar seu desempenho por meio do feedback do usuário.

Visão geral

Especialistas no domínio, como analistas de dados, configuram os espaços do genie com conjunto de dados, consultas de amostra e diretrizes de texto para ajudar o genie a traduzir perguntas comerciais em consultas analíticas. Após a configuração, os usuários corporativos podem fazer perguntas e gerar visualizações para entender os dados operacionais. O senhor pode atualizar continuamente o conhecimento semântico do genieà medida que seus dados mudam e os usuários fazem novas perguntas. Para obter informações adicionais sobre DatabricksIQ, consulte DatabricksIQ-powered recurso.

AI/BI Genie seleciona nomes e descrições relevantes de tabelas e colunas de anotações para converter perguntas em linguagem natural em uma consulta equivalente no site SQL. Em seguida, ele responde com a consulta gerada e a tabela de resultados, se possível. Se o Genie não conseguir gerar uma resposta, ele pode fazer perguntas de acompanhamento para esclarecer antes de fornecer uma resposta.

Exemplos de casos de uso

Você pode criar diversos espaços do Genie para atender a vários públicos não técnicos. Os cenários a seguir descrevem dois possíveis casos de uso.

Exemplo 1: visualize o status da oportunidade

Um gerente de vendas deseja obter o status atual das oportunidades abertas e fechadas por estágio em seu pipeline de vendas. Eles podem interagir com o espaço Genie com linguagem natural e gerar automaticamente uma prévia.

O gif a seguir mostra essa interação:

Gif com amostra de pergunta, resposta e prévia gerada automaticamente

Exemplo 2: acompanhamento logístico

Uma empresa de logística quer utilizar os espaços Genie para ajudar os usuários de negócios de diversos departamentos a acompanhar detalhes operacionais e financeiros. Eles criaram um espaço Genie para seus gerentes de instalações de remessa acompanharem as remessas e outro para seus executivos financeiros compreenderem sua saúde financeira.

Como o Genie gera uma resposta

Genie usa um sistema composto AI para interpretar perguntas comerciais e gerar respostas. Em vez de usar modelos AI, que são modelos estatísticos simples, os sistemas compostos AI processam a tarefa em aplicativos AI combinando vários componentes que interagem entre si. Os sistemas compostos AI são um padrão de design cada vez mais comum para aplicativos AI devido ao seu desempenho e flexibilidade. Para obter mais informações, consulte The Shift from Models to Compound AI Systems .

Quando um usuário envia uma pergunta, o site Genie analisa a solicitação, identifica as fontes de dados relevantes e determina como responder ao prompt. As instruções que o senhor fornece, combinadas com os metadados do Unity Catalog, permitem que o Genie deduza a lógica comercial e técnica. Genie filtra de forma inteligente exemplos de consultas SQL, metadados de tabelas e colunas e histórico de bate-papo para selecionar as informações mais relevantes para responder à solicitação.

O Genie usa os seguintes componentes para gerar respostas:

  • Metadados da tabela: key Inclui nomes de tabelas, descrições e relacionamentos key primários (PK) e estrangeiros (FK) definidos. O Genie usa esses dados à medida que analisa a solicitação e converte o prompt de linguagem natural em SQL.

  • Nomes e descrições de colunas: O Genie filtra de forma inteligente os nomes e as descrições de colunas relevantes a serem incluídos.

  • Exemplos de consultas SQL: O Genie seleciona de forma inteligente exemplos de SQL relevantes das instruções.

  • Funções SQL: Todas as funções SQL que foram adicionadas ao espaço.

  • Instruções: As notas em texto simples fornecidas como instruções gerais são incluídas como contexto.

  • Histórico de prompts e respostas: Os prompts e as respostas do chat atual são incluídos como contexto. Se necessário, devido aos limites de tokens definidos, as partes mais antigas do registro do chat são excluídas.

Observação

Alguns detalhes da tabela, como o proprietário e o tamanho da tabela, não são incluídos pelo site default. Para acessar essas informações, o senhor pode usar a visualização do esquema de informações disponível para todos os catálogos do site Unity Catalog. A visualização padrão pode incluir detalhes desnecessários, portanto, a criação de um view personalizado pode ajudar o senhor a se concentrar nas informações específicas de que precisa. Para obter mais informações sobre o que está disponível no esquema de informações, consulte o esquema de informações.

Se o site Genie retornar uma consulta como resultado, ela será executada no site SQL warehouse designado. As tentativas são tratadas automaticamente, e o site SQL warehouse lida com a simultaneidade e a escala.

Quais dados devo usar?

Um espaço Genie pode incluir uma ou mais tabelas registradas em Unity Catalog, incluindo tabelas gerenciais, tabelas externas, tabelas estrangeiras e visualizações materializadas. O AI/BI Genie usa os metadados anexados aos objetos do Unity Catalog para gerar respostas. Um conjunto de dados bem anotado, juntamente com instruções específicas que o senhor fornece, são key para criar uma experiência positiva para os usuários finais.

A Databricks recomenda o seguinte:

  • Organize dados para consumo analítico: visões em camadas para reduzir o número de colunas e adicionar informação específicas do caso de uso para aumentar a qualidade da resposta.

  • Minimize o número de tabelas e colunas em um espaço do Genie: Inclua apenas as tabelas e colunas necessárias para responder às perguntas de um determinado domínio. Tabelas ou colunas desnecessárias podem fazer com que o Genie forneça respostas confusas ou incorretas ou exiba uma mensagem de erro.

  • Defina as relações primárias key (PK)/estrangeiras key (FK): Use o site Unity Catalog para definir os relacionamentos PK/FK para que o site Genie entenda como seus dados estão conectados.

Ativo confiável

Os ativos confiáveis transmitem uma camada extra de garantia da precisão de um resultado para um usuário do espaço. Quando o texto exato de uma consulta de exemplo parametrizada ou função SQL é usado para gerar uma resposta, o Genie marca a resposta como um ativo confiável. Veja Use trusted ativo em AI/BI Genie spaces .

Tópicos de bate-papo

A maioria das interações no espaço do Genie ocorre em uma janela de bate-papo. Os tópicos de bate-papo salvam um registro das interações de cada usuário. Cada tópico de bate-papo mantém o contexto sobre as perguntas anteriores que foram feitas. Genie usa o contexto no histórico de bate-papo encadeado para aprender à medida que os usuários fazem perguntas de acompanhamento para explorar mais ou reorientar um conjunto de resultados.

Os usuários com pelo menos CAN VIEW acesso a um espaço podem view sua própria história de bate-papo. Os usuários com pelo menos CAN EDIT privilégios podem revisar todas as perguntas e respostas na história do espaço tab.

Revise as respostas

A maioria das respostas inclui uma explicação em linguagem natural e uma tabela mostrando o conjunto de resultados relevante. A estrutura de resposta precisa varia de acordo com a pergunta. Todas as respostas incluem a consulta SQL que foi gerada para responder à pergunta.

Usuários e autores do espaço podem revisar as respostas às suas perguntas. Eles podem avaliar cada resposta com o polegar para cima ou para baixo ou solicitar que uma resposta seja revisada. Os editores e autores do espaço podem revisar esse feedback usando a ícone da história história tab no espaço Genie.

Avalie as respostas com benchmarks

Os benchmarks permitem que o senhor amplie os testes e a avaliação de respostas individuais em um espaço genie. Ao contrário das instruções, os benchmarks destinam-se a avaliar, e não a informar, seu espaço genie. genie não usa perguntas de referência ou exemplos do site SQL para melhorar o contexto do site genie.

Usando benchmarks, o senhor pode executar uma coleção de perguntas de teste e usar as respostas para medir a precisão do Genie. Opcionalmente, o senhor pode incluir uma instrução SQL que retorna os resultados esperados. Quando a pergunta de referência é executada, a resposta do Genieé comparada com os resultados fornecidos pela declaração do SQL e pontuada quanto à precisão. A pergunta é marcada para revisão se nenhuma resposta SQL tiver sido fornecida.

Consulte Usar benchmarks em um espaço genie .

Privacidade e segurança

P: Qual é o modelo usado pelo Genie?

genie usa o modelo Azure OpenAI.

P: Quais dados estão sendo enviados para o modelo?

genie Os espaços geram respostas a perguntas de linguagem natural usando metadados e instruções. genie não tem acesso a dados em nível de linha.

Para processar as respostas, o site genie usa o seguinte:

  • A solicitação de linguagem natural enviada pelo usuário

  • Nomes e descrições de tabelas

  • Títulos e descrições das colunas

  • Instruções gerais

  • Exemplo de consultas SQL

  • Funções SQL

P: O Azure OpenAI coleta meus dados?

Não. A Databricks optou pela isenção do programa de monitoramento de abuso e revisão humana, segundo o qual a Microsoft não armazena nenhum prompt e conclusão enviados ao serviço Azure OpenAI. Para obter mais informações, consulte a documentação do siteMicrosoft.