Trabalhar com um espaço AI/BI Genie
Prévia
Esse recurso está em Public Preview. Consulte Habilitar Genie spaces em seu account.
Visão geral
Especialistas no domínio, como analistas de dados, configuram os espaços do genie com conjunto de dados, consultas de amostra e diretrizes de texto para ajudar o genie a traduzir perguntas comerciais em consultas analíticas. Após a configuração, os usuários corporativos podem fazer perguntas e gerar visualizações para entender os dados operacionais. O senhor pode atualizar continuamente o conhecimento semântico do genieà medida que seus dados mudam e os usuários fazem novas perguntas. Para obter informações adicionais sobre DatabricksIQ, consulte DatabricksIQ-powered recurso.
AI/BI genie seleciona nomes e descrições relevantes de tabelas e colunas de anotações para converter perguntas em linguagem natural em uma consulta equivalente no site SQL. Em seguida, ele responde com a consulta gerada e a tabela de resultados, se possível. Se o site genie não conseguir gerar uma resposta, ele poderá fazer perguntas de acompanhamento para esclarecer enquanto tenta fornecer uma resposta.
Exemplos de casos de uso
Você pode criar diversos espaços do Genie para atender a vários públicos não técnicos. Os cenários a seguir descrevem dois possíveis casos de uso.
Exemplo 1: visualize o status da oportunidade
Um gerente de vendas deseja obter o status atual das oportunidades abertas e fechadas por estágio em seu pipeline de vendas. Eles podem interagir com o espaço Genie com linguagem natural e gerar automaticamente uma prévia.
O gif a seguir mostra essa interação:
Exemplo 2: acompanhamento logístico
Uma empresa de logística quer utilizar os espaços Genie para ajudar os usuários de negócios de diversos departamentos a acompanhar detalhes operacionais e financeiros. Eles criaram um espaço Genie para seus gerentes de instalações de remessa acompanharem as remessas e outro para seus executivos financeiros compreenderem sua saúde financeira.
Requisitos e limites técnicos
Os seguintes requisitos e limites se aplicam ao uso dos espaços do site genie:
Unity Catalog: Os dados do espaço genie devem ser registrados no Unity Catalog
computar: O senhor deve usar um profissional ou serverless SQL warehouse.
capacidade de espaço de trabalho: Cada workspace pode ter até 1.000 espaços genie.
Permissões necessárias
As seguintes permissões são necessárias para criar, editar e usar os espaços do site genie:
Permissões de computação: os criadores, editores e usuários do espaço genie precisam de acesso CAN USE ao default SQL warehouse designado para o espaço. Os criadores selecionam o site default SQL warehouse quando criam um espaço. Eles podem selecionar qualquer SQL warehouse para o qual tenham permissões CAN RUN.
Permissões de acesso a dados: qualquer usuário que interaja com o espaço precisa de pelo menos privilégios
SELECT
nos dados usados em um espaço.genie permissões de espaço: Os usuários precisam de permissões CAN RUN no espaço genie para interagir com genie e com os dados usados no espaço. Consulte genie space ACLs para obter um mapeamento completo de privilégios e habilidades para um espaço genie.
Observação
A configuração do acesso aos dados e à computação exige permissões elevadas, geralmente restritas a um administrador. Consulte Criar um warehouse do SQL e Gerenciar privilégios no Unity Catalog.
Habilite o site Genie spaces em seu account
Observação
O senhor deve ser um administrador do site account para ativar esse recurso.
Genie usa recurso alimentado por parceiros que deve ser ativado no nível account.
Um administrador do site account pode habilitar esses recursos completando os seguintes passos:
Na barra lateral do consoleaccount , clique em Settings (Configurações).
Clique na guia Ativação de recursos .
Ative a opção Enable parceiros-powered IA recurso.
Os parceiros-powered AI recurso devem ser ativados no nível account antes que o Genie possa ser ativado para um workspace.
Habilite o Genie em seu espaço de trabalho
Genie é gerenciado na página workspace Previews, onde é ativado por default. Depois que o recurso AI, alimentado por parceiros, for ativado para o account, o Genie se tornará acessível aos usuários com o direito SQL.
Os administradores do espaço de trabalho podem controlar o acesso a Genie no nível workspace. Veja gerenciar Databricks Previews.
Crie um novo Genie space
Quando os espaços genie são ativados em um workspace analista de dados pode criar uma experiência de espaço genie específica do domínio para os usuários corporativos, seguindo os seguintes passos:
Clique em genie na barra lateral.
Clique em Novo no canto superior direito da tela.
Na caixa de diálogo Novo, escolha suas configurações iniciais. As opções são descritas da seguinte forma:
Título: O título aparece no navegador do espaço de trabalho com outros objetos do espaço de trabalho. Escolha um título que ajude os usuários finais a descobrir seu espaço Genie.
Descrição: Os usuários veem a descrição quando abrem o espaço do Genie. Use essa área de texto para descrever a finalidade dos espaços. O campo de descrição oferece suporte à formatação Markdown para que você possa estilizar seu texto e fornecer links para contextos e referências úteis. Para obter mais informações sobre a sintaxe do markdown, consulte este guia.
armazém padrão: Esse recurso compute alimenta as declarações SQL geradas nos espaços genie. Os usuários finais precisam acessar esse depósito para interagir com o espaço. Um espaço genie pode usar um profissional ou serverless SQL warehouse. Para um desempenho ideal, o site Databricks recomenda o uso de um serverless SQL warehouse.
Tabelas: Os espaços Genie podem ser baseados em uma ou mais tabelas. O botão Add tables (Adicionar tabelas ) abre uma nova caixa de diálogo na qual você pode selecionar as tabelas do Unity Catalog que deseja incluir.
Exemplos de perguntas: As perguntas de exemplo são opcionais. Eles aparecem nos bate-papos para apresentar exemplos dos tipos de perguntas que os usuários podem fazer. Eles podem ser adicionados durante a criação ou posteriormente nas Configurações do espaço.
Quais dados devo usar?
O senhor pode criar um novo Genie spaces com base em uma ou mais tabelas registradas em Unity Catalog, incluindo tabelas gerenciais, tabelas externas, tabelas estrangeiras e visualizações materializadas. O AI/BI Genie usa os metadados anexados aos objetos do Unity Catalog para gerar respostas. Um conjunto de dados bem anotado, juntamente com instruções específicas que o senhor fornece, são key para criar uma experiência positiva para os usuários finais.
A Databricks recomenda o seguinte:
Organize dados para consumo analítico: visões em camadas para reduzir o número de colunas e adicionar informação específicas do caso de uso para aumentar a qualidade da resposta.
Minimizar o número de tabelas e colunas em um espaço genie: Traga apenas as tabelas e colunas necessárias para responder às perguntas de um determinado domínio. Tabelas ou colunas desnecessárias podem fazer com que o site genie forneça respostas confusas ou incorretas, ou exiba uma mensagem de erro.
Apresentar instruções
As instruções ajudam a orientar as respostas do geniepara que ele possa processar o jargão, a lógica e os conceitos exclusivos de um determinado domínio. Instruções abrangentes são essenciais para uma experiência perfeita e intuitiva no espaço genie. Para inserir instruções, clique em Instructions (Instruções ) na barra lateral do espaço genie para abrir o painel de instruções. Use esse painel para adicionar instruções gerais, exemplos de consultas SQL e funções SQL.
Instruções gerais
Forneça instruções em texto simples que transmitam claramente suas preferências comerciais ou de resposta para que o site genie as siga. Você pode formatar as instruções como uma única nota abrangente ou categorizá-las por tópicos para uma melhor organização.
A seguir, um exemplo de informações que o senhor poderia incluir nas instruções gerais:
Informações comerciais específicas da empresa:
"Nosso ano fiscal começa em fevereiro"
Valores, aliases ou filtros comuns:
"Sempre converta para letras minúsculas e utilize um operador semelhante ao aplicar filtros."
"Use abreviações para estados em valores de filtro."
Especifique funções para responder perguntas e fornecer instruções para valores de retorno:
"Para trimestres, use o
adventureworks.oneb.get_quarter(date)
UDF. A saída deget_quarter()
é o trimestre e é 1,2,3 ou 4. Use isso para filtrar os dados conforme necessário.
Exemplo de consultas SQL
As consultas de exemplo SQL são consultas SQL que o senhor prepara para ajudar a ensinar genie. Ao responder às perguntas, o site genie seleciona de forma inteligente as consultas relevantes para ajudar a gerar a resposta. Ao adicionar consultas de exemplo, o senhor está efetivamente mostrando ao site genie como usar seus dados para responder a perguntas. O senhor também pode adicionar perguntas de exemplo para ensinar ao genie os tipos de perguntas que espera que a consulta de exemplo responda. Se o site genie receber uma pergunta correspondente, ele poderá usar a consulta de exemplo diretamente para fornecer uma resposta. Se o senhor receber uma pergunta semelhante, ele poderá usar pistas da consulta de exemplo para ajudar a estruturar o SQL fornecido na resposta. Concentre-se em fornecer amostras que destaquem a lógica exclusiva de sua organização e de seus dados, como no exemplo a seguir:
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
Adicionar parâmetros em consultas SQL
Os parâmetros permitem que você escreva exemplos de consultas que incluem espaços reservados para valores específicos a serem substituídos em tempo de execução. Com parâmetros, o genie pode receber entradas específicas de perguntas de usuários e reutilizar a estrutura de um exemplo de consulta para fornecer respostas verificadas como ativo confiável. Por exemplo, o senhor poderia ajustar a consulta anterior SQL para incluir um parâmetro que filtra pelo valor o.forecastcategory
, permitindo que a consulta aborde perguntas sobre tags de oportunidades em diferentes categorias de previsão. Para obter mais informações sobre como usar consultas parametrizadas para gerar respostas a rótulo de ativo confiável, consulte Use trusted ativo in AI/BI genie spaces.
O trecho de código a seguir mostra o exemplo anterior, modificado pela adição de um parâmetro para o valor o.forecastcategory
. Os parâmetros usam a mesma sintaxe dos marcadores de parâmetros nomeados. Consulte Marcadores de parâmetros nomeados.
-- Return our current pipeline at a stage by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = :forecast_category AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
Para adicionar um parâmetro a uma consulta:
Coloque o cursor onde você deseja colocar o parâmetro em sua consulta.
Clique em Adicionar parâmetro para inserir um novo parâmetro.
Isso cria um novo parâmetro com o nome default
parameter
. Para alterar o nome default, substitua-o no editor de consultas. Você também pode adicionar parâmetros digitando dois pontos seguidos por um nome de parâmetro (:parameter_name
) no editor.
Editar um parâmetro de consulta
Para editar um parâmetro, faça o seguinte:
Clique ao lado do nome do parâmetro. Uma caixa de diálogo de detalhes do parâmetro é exibida e inclui as seguintes opções de configuração:
Palavra-chave: a palavra-chave que representa o parâmetro na consulta. Isso só pode ser alterado atualizando diretamente o texto na consulta.
Nome de exibição: o nome legível por humanos que o site genie usa na experiência de bate-papo. Quando o site genie usa uma consulta parametrizada para gerar uma resposta, ele inclui o nome de exibição e o valor associado na resposta.
Type (Tipo): Os tipos suportados incluem cadeias de caracteres, data, data e hora e numérico.
O tipo de default é strings.
O tipo de dados numérico permite especificar entre decimal e inteiro. O tipo numérico do site default é Decimal.
Observação
Se o valor de entrada real não corresponder ao tipo de parâmetro selecionado, o site genie tratará o valor de entrada como o tipo incorreto, o que pode levar a resultados imprecisos.
Clique em outra parte da interface do usuário para fechar a caixa de diálogo.
Funções SQL
SQL são funções personalizadas que são armazenadas em Unity Catalog e usadas por genie para responder a perguntas específicas. genie pode chamar essas funções e inserir qualquer parâmetro especificado pelo usuário, mas não pode acessar o conteúdo subjacente do site SQL. Isso significa que as funções do site SQL são ideais para responder a perguntas específicas comuns que incluem argumentos ou cálculos complexos que o site genie não deve ser capaz de acessar ou editar. Para obter orientação sobre o registro de uma função no Unity Catalog, consulte Criar uma função de tabela SQL e Funções definidas pelo usuário (UDFs) no Unity Catalog.
Ativo confiável
Quando o texto exato de uma consulta de exemplo parametrizada ou da função SQL é usado para gerar uma resposta, o site genie marca a resposta como um Trusted ativo. Os ativos confiáveis têm o objetivo de transmitir uma camada extra de garantia da precisão de um resultado para um usuário do espaço. Consulte Usar ativo confiável em AI/BI genie spaces.
Bate-papo no espaço Genie
A maioria das interações no espaço genie ocorre em uma janela de bate-papo.
Uma nova janela de bate-papo inclui um conjunto de exemplos de perguntas selecionadas. Esses exemplos de perguntas ajudam os usuários a entender quais perguntas podem fazer ao espaço do Genie. O campo de texto, onde os usuários inserem as perguntas, fica próximo à parte inferior da tela.
As respostas aparecem acima do campo de texto. Depois que um usuário insere uma pergunta, ela é salva em um tópico do histórico de bate-papo no painel esquerdo.
História de bate-papo
Os tópicos do histórico de bate-papo são salvos para cada usuário para eles poderem consultar perguntas e respostas anteriores. Os usuários também podem reenviar ou revisar perguntas de um tópico de bate-papo. O botão Novo bate-papo no painel esquerdo inicia um novo tópico.
Cada tópico de bate-papo mantém o contexto sobre as perguntas anteriores que foram feitas. Isso permite que os usuários façam perguntas complementares para explorar ou reorientar um conjunto de resultados.
Os tópicos da história do chat são armazenados indefinidamente e permanecem acessíveis até que o tópico ou o espaço Genie seja excluído. Os usuários com permissão CAN MANAGE ou superior podem view todos os bate-papos dentro do espaço.
Estrutura de resposta
A estrutura exata da resposta varia de acordo com a pergunta. Muitas vezes, as respostas incluem uma explicação em linguagem natural e uma tabela que mostra o conjunto de resultados relevantes. Todas as respostas incluem a consulta SQL que foi gerada para responder à pergunta. Clique em Show generated code (Mostrar código gerado ) para ver a consulta gerada.
Um conjunto de botões abaixo da resposta permite que o senhor execute várias ações. O senhor pode dar um voto positivo ou negativo para indicar a qualidade da resposta ou solicitar uma avaliação de usuários com permissão CAN EDIT ou superior no espaço do Genie. As opções adicionais incluem adicionar a resposta como uma instrução, gerar novamente a resposta ou visualizar o código SQL usado para gerar o conjunto de resultados na resposta.
Um conjunto de blocos de ações rápidas segue respostas que incluem dados tabulares. Você pode usá-los para gerar visualizações.
Você também pode gerar uma prévia descrevendo-a em palavras depois de obter um resultado de consulta.
Formatar resultados
Para formatar uma coluna em uma tabela dentro de uma resposta, clique no menu kebab no cabeçalho da coluna e, em seguida, clique em Format para view as opções disponíveis. As opções de formatação dependem do tipo de dados da coluna.
Baixe o conjunto de resultados
Os usuários do espaço podem fazer o download de até aproximadamente 1 GB de dados de resultados como um CSV. O tamanho final do arquivo download pode ser um pouco maior ou menor que 1 GB, pois o limite de 1 GB é aplicado a um passo anterior ao arquivo final download. Para fazer o download dos resultados, clique no ícone de download na resposta.
Apresentar feedback de resposta
Cada resposta do AI/BI genie inclui um botão de feedback de polegar para cima ou para baixo. A Databricks recomenda incentivar os usuários a fornecer feedback sobre o espaço usando esse mecanismo.
Para uma resposta que inclua resultados de consultas, os usuários podem solicitar que ela seja revisada por um editor do espaço genie clicando em . Se um usuário tiver dúvidas sobre a qualidade ou a precisão de uma resposta gerada, ele poderá marcá-la para análise e, opcionalmente, adicionar seu comentário ou pergunta.
Os usuários corporativos podem view atualizar as perguntas que marcaram para revisão em sua página de histórico. Os usuários com pelo menos CAN MANAGE permissão no espaço genie podem analisar a troca específica, comentar a solicitação e confirmar ou corrigir a resposta. Eles podem acessar as solicitações de feedback e revisão na página de monitoramento. Depois, você pode usar esse feedback para ajustar as respostas e iterar em seu espaço. Consulte Revisar histórico e feedback.
Revisão do histórico e feedback
Um espaço genie deve ser uma ferramenta de colaboração contínua para que as equipes de dados e os usuários corporativos acumulem conhecimento, e não uma implantação única. Compreender as novas perguntas para as quais os usuários corporativos precisam de respostas é essencial para a construção do conhecimento. Na página de histórico, o senhor pode view perguntas e respostas individuais, comentários com polegar para cima ou para baixo fornecidos pelos usuários e perguntas marcadas para revisão. Para abrir a página de histórico, clique em história na barra lateral do espaço genie.
A página de histórico mostra todas as perguntas e respostas que foram feitas no espaço. Você pode filtrar as perguntas por horário, classificação, usuário ou status. Ao monitorar o espaço, os editores do espaço genie podem entender proativamente as consultas levantadas pelos usuários corporativos e como o espaço genie respondeu.
Ao identificar as perguntas com as quais o Genie tem dificuldade, você pode atualizar o espaço do Genie com instruções específicas para melhorar suas respostas. Clique em uma pergunta para abrir o texto da pergunta e da resposta. Você também pode acessar o tópico completo do bate-papo nesta view.
Editar SQL gerado
O senhor pode revisar e editar o SQL gerado em qualquer resposta. genie Os autores de espaço normalmente conhecem o domínio e os dados que lhes permitem reconhecer quando o genie está gerando uma resposta incorreta. Muitas vezes, os erros podem ser corrigidos com um pequeno ajuste manual na consulta SQL gerada. Para view o SQL gerado para qualquer resposta, clique em Show generated code (Mostrar código gerado ) para inspecionar a consulta.
O senhor pode editar a declaração SQL gerada para corrigi-la se tiver privilégios CAN EDIT ou superiores no espaço genie. Depois de fazer as correções, execute a consulta. Em seguida, o senhor pode salvá-la como uma instrução para ensinar a genie como responder no futuro. Para salvar a consulta editada, clique em Save as instruction (Salvar como instrução).
Avalie as respostas com benchmarks
Os benchmarks permitem que o senhor amplie os testes e a avaliação de respostas individuais em um espaço genie. Ao contrário das instruções, os benchmarks destinam-se a avaliar, e não a informar, seu espaço genie. genie não usa perguntas de referência ou exemplos do site SQL para melhorar o contexto do site genie.
Usando benchmarks, o senhor pode executar uma coleção de perguntas de teste e usar as respostas para medir a precisão do genie. Opcionalmente, o senhor pode incluir uma instrução SQL que retorna os resultados esperados. Quando a pergunta de referência é executada, a resposta do genieé comparada com os resultados fornecidos pela declaração do SQL e pontuada quanto à precisão. Se nenhuma resposta SQL tiver sido fornecida, a pergunta será marcada para revisão.
Consulte Usar benchmarks em um espaço genie .
Clonar um espaço Genie
A clonagem de um espaço genie cria uma cópia, incluindo todo o contexto e as instruções de configuração. Isso é útil se você tiver um espaço bem desenvolvido e quiser criar um novo espaço para testes adicionais ou reutilizar o contexto do espaço original. Depois que um espaço é clonado, o novo espaço é independente do original, permitindo que você faça edições e ajustes sem afetar o original.
Os seguintes elementos são copiados para um espaço genie clonado:
Tabelas e configurações
Instruções gerais
Exemplo de consultas SQL
Funções SQL
Os tópicos de bate-papo e os dados do histórico existentes não são copiados para o novo espaço.
Para clonar um espaço genie, faça o seguinte:
Abra o espaço genie que o senhor deseja clonar.
Clique no menu de kebab no canto superior direito do espaço.
Clique em Clonar.
(Opcional) Na caixa de diálogo Clone, especifique um novo nome e o local da pasta workspace para o espaço genie clonado.
Clique em Clonar para criar o novo espaço.
Privacidade e segurança
P: Quais dados estão sendo enviados para o modelo?
genie Os espaços geram respostas a perguntas de linguagem natural usando metadados e instruções. genie não tem acesso a dados em nível de linha.
Para processar as respostas, o site genie usa o seguinte:
A solicitação de linguagem natural enviada pelo usuário
Nomes e descrições de tabelas
Títulos e descrições das colunas
Instruções gerais
Exemplo de consultas SQL
Funções SQL
P: O Azure OpenAI coleta meus dados?
Não. A Databricks optou pela isenção do programa de monitoramento de abuso e revisão humana, segundo o qual a Microsoft não armazena nenhum prompt e conclusão enviados ao serviço Azure OpenAI. Para obter mais informações, consulte a documentação do siteMicrosoft.
Práticas recomendadas para a preparação do espaço
Antes de construir, estabeleça um conjunto de perguntas bem definidas que o senhor deseja que os usuários do espaço sejam capazes de responder.
Teste seu espaço Genie para verificar a qualidade da resposta. Tente o seguinte para ver se o modelo apresenta a resposta esperada:
Reformule as perguntas apresentadas.
Faça outras perguntas relacionadas aos dataset.
Adicione e refine as instruções do espaço Genie até as perguntas apresentarem a resposta esperada.
Para obter mais orientações sobre as práticas recomendadas e ajuda para solucionar problemas, consulte Organizar um espaço genie eficaz.