O que é um espaço Genie?

Prévia

Este recurso está em Prévia pública. Os administradores do espaço de trabalho podem ativar esse recurso na página Pré-visualizações. Consulte Manage Databricks Previews.

O AI/BI Genie é uma interface sem código desenvolvida pela DatabricksIQ que permite que os usuários corporativos realizem análises de dados de autoatendimento com linguagem natural. Os especialistas no domínio, como os analistas de dados, configuram os espaços do Genie com conjuntos de dados, consultas de amostra e diretrizes de texto para ajudar o Genie a traduzir perguntas comerciais em consultas analíticas. Após a configuração, os usuários corporativos podem fazer perguntas e gerar visualizações para entender os dados operacionais. O Genie atualiza continuamente seu conhecimento semântico à medida que seus dados mudam e os usuários fazem novas perguntas. Veja recursos alimentados pelo DatabricksIQ.

Os analistas de dados podem preparar uma experiência de espaço Genie específica do domínio para usuários corporativos fazendo o seguinte:

  • Seleção de tabelas relevantes do Unity Catalog e exposição de seus metadados (descrições de tabelas e colunas) no espaço Genie.

  • Adição de instruções que transferem informações específicas da organização (lógica de negócios e metadados) para o espaço do Genie.

Após a configuração inicial, o usuário pode melhorar cada vez mais a compreensão do Genie sobre seus dados e a semântica ao longo do tempo, salvando respostas SQL verificadas como instruções. Consulte Apresentar instruções.

Exemplos de casos de uso

Você pode criar diversos espaços do Genie para atender a vários públicos não técnicos. Os cenários a seguir descrevem dois possíveis casos de uso.

Consulte o status da oportunidade

Um gerente de vendas deseja obter o status atual das oportunidades abertas e fechadas por estágio em seu pipeline de vendas. Eles podem interagir com o espaço Genie com linguagem natural e gerar automaticamente uma prévia.

O gif a seguir mostra essa interação:

Gif com amostra de pergunta, resposta e prévia gerada automaticamente

Logística de acompanhamento

Uma empresa de logística quer utilizar os espaços Genie para ajudar os usuários de negócios de diversos departamentos a acompanhar detalhes operacionais e financeiros. Eles criaram um espaço Genie para seus gerentes de instalações de remessa acompanharem as remessas e outro para seus executivos financeiros compreenderem sua saúde financeira.

Como são geradas as respostas espaciais do Genie?

Os espaços Genie geram respostas a perguntas de linguagem natural utilizando nomes e descrições de tabelas e colunas. Os dados reais nas tabelas permanecem ocultos ao Genie.

O Genie utiliza os nomes e as descrições para converter perguntas em linguagem natural em uma consulta SQL equivalente. Em seguida, ele responde com os resultados dessa consulta como uma tabela. Autores e usuários corporativos do Genie Space podem inspecionar a consulta SQL gerada que produz cada resposta.

Requisitos técnicos

  • Os espaços Genie usam dados registrados no Unity Catalog.

  • Os espaços Genie exigem um warehouse SQL Pro ou Serverless.

Permissões necessárias

As seguintes permissões são necessárias para criar, editar e utilizar os espaços do Genie.

Observação

A configuração do acesso aos dados e à computação exige permissões elevadas, geralmente restritas a um administrador. Consulte Criar um warehouse do SQL e Gerenciar privilégios no Unity Catalog.

  • Compute permissões: Criadores, editores e usuários precisam de acesso CAN USE ao default SQL warehouse designado para o espaço. Os autores selecionam o default SQL warehouse ao criarem um espaço. O autor pode selecionar qualquer SQL warehouse para o qual tiver permissões de CAN RUN.

  • Permissões de acesso a dados: qualquer usuário que interaja com o espaço precisa de pelo menos privilégios SELECT nos dados usados em um espaço.

  • Permissões de espaço do Genie: Os usuários precisam de permissões CAN RUN no espaço do Genie para interagir com o Genie e os dados usados no espaço. Consulte ACLs espaciais do Genie para obter um mapeamento completo de privilégios e habilidades para um espaço do Genie.

Quais dados devo usar?

Você pode criar novos espaços Genie com base em uma ou mais tabelas gerenciadas do Unity Catalog. O Genie utiliza os metadados anexados aos objetos do Unity Catalog para gerar respostas. Datasets bem anotados com instruções específicas que você apresenta são importantes para criar uma experiência positiva para os usuários finais.

A Databricks recomenda o seguinte:

  • Organize dados para consumo analítico: visões em camadas para reduzir o número de colunas e adicionar informação específicas do caso de uso para aumentar a qualidade da resposta.

  • Minimizar o número de tabelas e colunas em um espaço Genie: traga apenas as tabelas e colunas necessárias para responder às perguntas de um determinado domínio. Tabelas ou colunas desnecessárias podem fazer com que o Genie forneça respostas confusas ou incorretas ou exiba uma mensagem de erro.

Crie um novo Genie space

Novo diálogo de espaço, conforme descrito na lista a seguir.

Quando você cria um novo espaço Genie, uma caixa de diálogo Novo espaço mostra as seguintes opções:

  • Título: O título aparece no navegador do espaço de trabalho com outros objetos do espaço de trabalho. Escolha um título que ajude os usuários finais a descobrir seu espaço Genie.

  • Descrição: Os usuários veem a descrição quando abrem o espaço do Genie. Use essa área de texto para descrever a finalidade da sala.

  • Armazém padrão: Esse recurso de computação alimenta as instruções SQL geradas nos espaços do Genie. Os usuários finais precisam ter acesso a esse depósito para poderem interagir com o espaço. Um espaço genie pode utilizar um SQL warehouse profissional ou serverless. Os armazéns de SQL sem servidor oferecem desempenho ideal.

  • Tabelas: Os espaços Genie podem ser baseados em uma ou mais tabelas. O botão Add tables (Adicionar tabelas ) abre uma nova caixa de diálogo na qual você pode selecionar as tabelas do Unity Catalog que deseja incluir.

  • Exemplos de perguntas: As perguntas de exemplo são opcionais. Eles aparecem nos bate-papos para apresentar exemplos dos tipos de perguntas que os usuários podem fazer. Eles podem ser adicionados durante a criação ou posteriormente nas Configurações do espaço.

Bate-papo no espaço Genie

A maioria das interações do espaço Genie ocorre na janela de bate-papo.

Nova janela de bate-papo conforme descrito no texto a seguir.

Uma nova janela de bate-papo inclui um conjunto de exemplos de perguntas selecionadas. Esses exemplos de perguntas ajudam os usuários a entender quais perguntas podem fazer ao espaço do Genie. O campo de texto, onde os usuários inserem as perguntas, fica próximo à parte inferior da tela.

As respostas aparecem acima do campo de texto. Depois que um usuário insere uma pergunta, ela é salva em um tópico do histórico de bate-papo no painel esquerdo.

História de bate-papo

Os tópicos do histórico de bate-papo são salvos para cada usuário para eles poderem consultar perguntas e respostas anteriores. Os usuários também podem reenviar ou revisar perguntas de um tópico de bate-papo. O botão Novo bate-papo no painel esquerdo inicia um novo tópico.

Cada tópico do bate-papo mantém seu contexto, de modo que o Assistente considera as perguntas anteriores que lhe foram feitas. Isso permite que os usuários façam perguntas de acompanhamento para explorar mais ou reorientar um conjunto de resultados.

Estrutura de resposta

A estrutura exata da resposta varia de acordo com a pergunta. Muitas vezes, as respostas incluem uma explicação em linguagem natural e uma tabela que mostra o conjunto de resultados relevantes. Todas as respostas incluem a consulta SQL que foi gerada para responder à pergunta. Clique em Show generated code (Mostrar código gerado ) para ver a consulta gerada.

O lado inferior direito da resposta inclui ações opcionais. Você pode copiar o CSV da resposta para sua área de transferência, baixá-lo como um arquivo CSV, adicioná-lo como uma instrução para o espaço Genie e votar positivamente ou negativamente na resposta.

Um conjunto de blocos de ações rápidas segue respostas que incluem dados tabulares. Você pode usá-los para gerar visualizações.

Blocos de ação rápida que sugerem diversas opções de prévia.

Você também pode gerar uma prévia descrevendo-a em palavras depois de obter um resultado de consulta.

Apresentar feedback de resposta

Todas as respostas do Genie contêm um botão de feedback do tipo "polegar para cima" ou "polegar para baixo". A Databricks recomenda incentivar os usuários a apresentar feedback sobre o espaço com esse mecanismo. O feedback pode ser usado para ajustar as respostas e iterar em seu espaço. É acessível através da página Monitoramento. Veja Monitorar o espaço.

Monitore o espaço

Um espaço Genie deve ser uma ferramenta de colaboração contínua para equipes de dados e usuários de negócios acumularem conhecimento, não uma implantação única. Conhecer as novas perguntas para as quais os usuários de negócios precisam de respostas é essencial para a construção do conhecimento. A página Monitoramento permite que você consulte perguntas e respostas individuais, bem como comentários de polegares para cima ou polegares para baixo fornecidos pelos usuários que trabalham com o espaço. Clique em Ícone de monitoramento Monitoramento na barra lateral de espaço do Genie para abrir a página de monitoramento.

Um exemplo de página de monitoramento mostrando os recursos descritos.

A página de monitoramento mostra todas as perguntas e respostas feitas no espaço. Você pode filtrar as perguntas por tempo, classificação, usuário ou status. O monitoramento do espaço pode ajudar os autores do Genie a entender proativamente as consultas levantadas pelos usuários corporativos e como o espaço do Genie respondeu.

Ao identificar as perguntas com as quais o Genie tem dificuldade, você pode atualizar o espaço do Genie com instruções específicas para melhorar suas respostas. Clique em uma pergunta para abrir o texto da pergunta e da resposta. Você também pode acessar o tópico completo do bate-papo nesta view.

Apresentar instruções

As instruções ajudam a orientar as respostas do genie para ele poder processar o jargão, a lógica e os conceitos exclusivos de um determinado domínio. Você pode escrever instruções como exemplos de consultas ou trechos de texto simples que ajudam o Genie a responder às perguntas que os usuários do espaço provavelmente farão. Instruções abrangentes são essenciais para uma experiência perfeita e intuitiva no espaço Genie.

Clique em ícone de instruções Instructions na barra lateral do espaço Genie para abrir o painel de instruções.

Painel de instruções

Os exemplos a seguir ilustram vários tipos de instruções:

  • Informações comerciais específicas da empresa:

    • "Nosso ano fiscal começa em fevereiro"

  • Valores, aliases ou filtros comuns:

    • "Sempre converta para letras minúsculas e utilize um operador semelhante ao aplicar filtros."

    • "Use abreviações para estados em valores de filtro."

  • **Funções definidas pelo usuário disponíveis por meio do Unity Catalog:**

    • “Para trimestres, utilize o UDF adventureworks.oneb.get_quarter(date) . O resultado de get_quarter é o trimestre, que pode ser 1, 2, 3 ou 4. Utilize isso para filtrar os dados conforme necessário.

      Por exemplo, para o trimestre 3, utilize where adventureworks.oneb.get_quarter(posted_date)= 3"`"

  • Exemplo de instruções SQL:

    • Você pode oferecer amostras das consultas que espera que o Assistente gere.

    • Concentre-se na apresentação de exemplos que destacam a lógica exclusiva da sua organização e dos dados, como no exemplo a seguir:

    -- Return our current total open pipeline by region.
    -- Opportunities are only considered pipelines if they are tagged as such.
    SELECT
      a.region__c AS `Region`,
      sum(o.amount) AS `Open Pipeline`
    FROM
      sales.crm.opportunity o
      JOIN sales.crm.accounts a ON o.accountid = a.id
    WHERE
      o.forecastcategory = 'Pipeline' AND
      o.stagename NOT ILIKE '%closed%'
    GROUP BY ALL;
    

Você pode organizar as instruções de espaço do Genie como uma observação longa ou agrupá-las por tópicos relacionados para melhor estruturação.

Editar SQL gerado

Você pode revisar e editar o SQL gerado em qualquer resposta. Os autores do espaço Genie normalmente têm conhecimento do domínio e dos dados que lhes permitem reconhecer quando o Genie está gerando uma resposta incorreta. Geralmente, os erros podem ser corrigidos com um pequeno ajuste manual na própria consulta SQL gerada. Para view o SQL gerado para qualquer resposta, clique em Show generated code (Mostrar código gerado ) para inspecionar a consulta.

Os usuários com privilégios de pelo menos CAN EDIT em um espaço Genie podem editar a instrução SQL gerada para corrigi-la. Após a edição, execute a consulta. Em seguida, salve como uma instrução para ensinar o Gênio a responder no futuro. Para salvar a consulta editada, clique em Salvar como ícone de instrução Salvar como instrução.

Práticas recomendadas para preparação de salas

  • Inclua um conjunto de perguntas bem definidas que você deseja que os usuários da sala possam responder.

  • Teste seu espaço Genie para verificar a qualidade da resposta. Tente o seguinte para ver se o modelo apresenta a resposta esperada:

    • Reformule as perguntas apresentadas.

    • Faça outras perguntas relacionadas aos dataset.

  • Adicione e refine as instruções do espaço Genie até as perguntas apresentarem a resposta esperada.

Compartilhe um espaço Genie

Importante

Os usuários do espaço Genie devem interagir com os dados com suas próprias credenciais. Perguntas sobre dados que não podem ser acessados geram respostas vazias.

Os usuários do espaço Genie devem ter permissões CAN USE no armazém anexado a um espaço Genie e permissões de acesso aos objetos do Unity Catalog exibidos no espaço. Consulte Quais dados devo usar?.

Os novos espaços Genie são salvos na sua pasta de usuário por padrão. Como outros objetos de espaço de trabalho, eles herdam as permissões da pasta que os contém. Você pode utilizar a estrutura de pastas do seu espaço de trabalho para compartilhá-las com outros usuários. Veja Organize objetos do workspace em pastas.

Você também pode especificar determinados usuários ou grupos com os quais compartilhar em um determinado nível de permissão: Pode gerenciar, Pode editar, Pode executar e Pode exibir.

Para compartilhar com usuários ou grupos específicos:

  1. Clique em Compartilhar.

  2. Na caixa de diálogo Compartilhar, clique em Abrir no Workspace.

  3. Na janela do navegador do Workspace, insira os usuários ou grupos com os quais deseja compartilhar e, em seguida, defina os níveis de permissão apropriados.