Pular para o conteúdo principal

O que é um espaço AI/BI Genie?

Esta página apresenta AI/BI Genie, um recurso Databricks que permite que as equipes de negócios interajam com seu uso de dados em linguagem natural. Ele usa o generativo AI adaptado à terminologia e aos dados da sua organização, com a capacidade de monitorar e refinar seu desempenho por meio do feedback do usuário.

Visão geral

Especialistas no domínio, como analistas de dados, configuram o site Genie spaces com conjunto de dados, consultas de amostra e diretrizes de texto para ajudar o Genie a traduzir perguntas comerciais em consultas analíticas. Após a configuração, os usuários corporativos podem fazer perguntas e gerar visualizações para entender os dados operacionais. O senhor pode atualizar continuamente o conhecimento semântico do Genie à medida que seus dados mudam e os usuários fazem novas perguntas. Para obter informações Databricks AIadicionais sobre -powered recurso, consulte Databricks AI-powered recurso.

AI/BI Genie seleciona nomes e descrições relevantes de tabelas e colunas de anotações para converter perguntas em linguagem natural em uma consulta equivalente no site SQL. Em seguida, ele responde com a consulta gerada e a tabela de resultados, se possível. Se o Genie não conseguir gerar uma resposta, ele pode fazer perguntas de acompanhamento para esclarecer antes de fornecer uma resposta.

Exemplos de casos de uso

Você pode criar diversos espaços do Genie para atender a vários públicos não técnicos. Os cenários a seguir descrevem dois possíveis casos de uso.

Exemplo 1: visualize o status da oportunidade

Um gerente de vendas deseja obter o status atual das oportunidades abertas e fechadas por estágio em seu pipeline de vendas. Eles podem interagir com o espaço Genie com linguagem natural e gerar automaticamente uma prévia.

O gif a seguir mostra essa interação:

Gif com amostra de pergunta, resposta e prévia gerada automaticamente

Exemplo 2: acompanhamento logístico

Uma empresa de logística quer utilizar os espaços Genie para ajudar os usuários de negócios de diversos departamentos a acompanhar detalhes operacionais e financeiros. Eles criaram um espaço Genie para seus gerentes de instalações de remessa acompanharem as remessas e outro para seus executivos financeiros compreenderem sua saúde financeira.

Quais dados devo usar?

Um espaço Genie é baseado em dados registrados em Unity Catalog, incluindo tabelas gerenciais, tabelas externas, tabelas estrangeiras, visualizações, visualizações métricas e visualizações materializadas. O AI/BI Genie usa os metadados anexados aos objetos do Unity Catalog, bem como um armazenamento de conhecimento em nível de espaço com curadoria do autor, para gerar respostas. Um conjunto de dados bem anotado, juntamente com instruções específicas que o senhor fornece, são key para criar uma experiência positiva para os usuários finais.

Upload de arquivos

info

Visualização

Esse recurso está em Public Preview.

O upload de arquivos permite que os usuários combinem seus arquivos locais CSV e Excel com dados Unity Catalog para responder a perguntas. Para ativar o upload de arquivos, entre em contato com a equipe do Databricks account . Para obter mais informações, consulte Carregar um arquivo.

Como o Genie funciona

Genie usa um sistema composto AI para interpretar perguntas comerciais e gerar respostas. Em vez de usar um único modelo de linguagem grande, os sistemas compostos AI processam tarefas em aplicativos AI combinando vários componentes que interagem entre si. Os sistemas compostos AI são um padrão de design cada vez mais comum para aplicativos AI devido ao seu desempenho e flexibilidade. Para obter mais informações, consulte The Shift from Models to Compound AI Systems.

O que é o armazenamento de conhecimento do Genie?

Genie Os autores podem adicionar metadados específicos da empresa e do espaço diretamente aos dados ativos em um espaço Genie. Isso inclui descrições de metadados de tabelas e colunas, sinônimos em nível de coluna, valores de amostra e dicionários de valores, que o Genie consulta ao gerar respostas. Uma camada de metadados detalhada ajuda o site Genie a recuperar as informações corretas e produzir resultados mais precisos.

Como o Genie gera uma resposta?

Quando um usuário envia uma pergunta, o site Genie analisa a solicitação, identifica as fontes de dados relevantes e determina como responder ao prompt. Os detalhes que os autores fornecem, combinados com os metadados do Unity Catalog, permitem que o Genie deduza a lógica comercial e técnica. Genie filtra de forma inteligente exemplos de consultas SQL, metadados de tabelas e colunas e histórico de bate-papo para selecionar as informações mais relevantes para responder à solicitação.

O Genie usa os seguintes componentes para gerar respostas:

  • Unity Catalog metadados da tabela : Inclui nomes de tabelas, descrições e relacionamentos key primários (PK) e relacionamentos key externos (FK) definidos. O Genie usa esses dados à medida que analisa a solicitação e converte o prompt de linguagem natural em SQL.
  • Nomes e descrições de colunas : O Genie filtra de forma inteligente os nomes e as descrições de colunas relevantes a serem incluídos.
  • Contexto do armazenamento de conhecimento : Os autores podem editar localmente os metadados da tabela para o ativo usado em um espaço Genie. Isso ajuda o Genie a gerar respostas mais precisas e não altera os metadados existentes no Unity Catalog. Consulte Configurar e gerenciar um espaço AI/BI Genie.
  • Exemplo de consultas SQL : Genie seleciona de forma inteligente exemplos relevantes de SQL a partir de consultasSQL .
  • Funções SQL : Todas as funções SQL que foram adicionadas ao espaço.
  • Instruções: As notas em texto simples fornecidas como instruções gerais são incluídas como contexto.
  • Histórico de prompts e respostas : Os prompts e as respostas do chat atual são incluídos como contexto. Se necessário, devido aos limites de tokens definidos, as partes mais antigas do registro do chat são excluídas.
nota

Alguns detalhes da tabela, como o proprietário e o tamanho da tabela, não são incluídos pelo site default. Para acessar essas informações, use a visualização do esquema de informações disponível para todos os catálogos do site Unity Catalog. A visualização padrão pode incluir detalhes desnecessários, portanto, a criação de um view personalizado pode ajudar o senhor a se concentrar nas informações específicas de que precisa. Para obter mais informações sobre o que está disponível no esquema de informações, consulte o esquema de informações.

Em muitos casos, o Genie gera uma consulta SQL que é executada no SQL warehouse do espaço. As consultas geradas são sempre somente para leitura. As tentativas são tratadas automaticamente, e o site SQL warehouse lida com a simultaneidade e a escala. O conjunto de resultados é apresentado como parte da resposta.

Configurar um espaço Genie

O senhor pode criar um espaço Genie se tiver:

  • O direito Databricks SQL.
  • Pelo menos a permissão CAN USE em um profissional ou serverless SQL warehouse.
  • Pelo menos SELECT privilégios em um ou mais objetos de dados do Unity Catalog.

Consulte Configurar e gerenciar um espaço AI/BI Genie.

Interaja com um espaço Genie

As equipes de negócios são os usuários finais de um espaço Genie. Para usar um espaço Genie, os usuários corporativos devem ter:

  • O acesso do consumidor ou Databricks SQL entitlement.
  • Pelo menos a permissão CAN USE no armazém default designado para o espaço Genie.
  • Pelo menos SELECT privilégios em todos os objetos de dados do Unity Catalog usados no espaço.

Os usuários corporativos podem ajudar a organizar um espaço testando-o e fornecendo feedback durante o desenvolvimento. Para saber mais sobre como os usuários corporativos podem começar a trabalhar com um espaço Genie, consulte Usar um espaço Genie para explorar dados corporativos.

Ativo confiável

Os ativos confiáveis transmitem uma camada extra de garantia da precisão de um resultado para um usuário do espaço. Quando o texto exato de uma consulta de exemplo parametrizada ou função SQL é usado para gerar uma resposta, o Genie marca a resposta como Confiável . Consulte Use trusted ativo em AI/BI Genie spacespara saber mais sobre trusted ativo. Consulte Usar parâmetros em consultas SQL para saber mais sobre como trabalhar com consultas parametrizadas.

Avalie as respostas com benchmarks

Os benchmarks permitem que o senhor amplie os testes e a avaliação de respostas individuais em um espaço Genie. Ao contrário das instruções, os benchmarks servem para avaliar, e não para informar, seu espaço Genie. O Genie não usa perguntas de referência ou exemplos de SQL para melhorar o contexto do Genie.

Usando benchmarks, o senhor pode executar uma coleção de perguntas de teste e usar as respostas para medir a precisão do Genie. Opcionalmente, o senhor pode incluir uma instrução SQL que retorna os resultados esperados. Quando a pergunta de referência é executada, a resposta do Genie é comparada com os resultados fornecidos pela declaração do SQL e pontuada quanto à precisão. A pergunta é marcada para revisão se nenhuma resposta SQL tiver sido fornecida.

Consulte Usar benchmarks em um espaço Genie.

Privacidade e segurança

P: Qual é o modelo usado pelo Genie?

Genie é um recurso com potência Databricks AI . Ele usa um sistema composto AI que combina o uso de modelos AI, sistemas de recuperação, classificação e personalização para entender os dados e os padrões de uso de sua organização. Para saber mais,Databricks AIconsulte -powered recurso.

P: Quais dados estão sendo enviados para o modelo?

O Genie usa seu prompt, metadados e valores de tabela relevantes, erros, bem como código de entrada ou consultas ao gerar uma resposta.

Para processar as respostas, o Genie usa o seguinte:

  • A solicitação de linguagem natural enviada pelo usuário
  • Nomes e descrições de tabelas
  • Títulos de colunas, descrições e valores de amostra
  • Instruções gerais
  • Exemplo de consultas SQL
  • Funções SQL

P: O Azure OpenAI armazena meus dados?

Não. Ao usar Azure modelos OpenAI por meio de Databricks, Microsoft não armazena prompts ou respostas por nenhum período de tempo em nenhum nível, nem mesmo na rede logs. Isso inclui dados que normalmente seriam usados para monitoramento de abuso. A Databricks optou por não participar do monitoramento de abuso e da análise humana do Azure OpenAI, portanto a Microsoft não retém nem inspeciona nenhum dado enviado pelo Genie. Para obter mais informações, consulte a documentação do siteMicrosoft.

P: Onde as respostas do Genie são armazenadas?

As respostas do Genie são armazenadas no plano de controle do Databricks.

Q: Há suporte para filtragem em nível de linha em um espaço Genie?

Sim, os privilégios concedidos no Unity Catalog controlam quais usuários podem acessar objetos de dados específicos. Se filtros de linha ou máscaras de coluna forem aplicados a um objeto de dados, eles controlam quais valores são retornados no conjunto de resultados. Consulte Filtro sensível à tabela uso de dados filtros de linha e máscaras de coluna.

P: Como meu tráfego é roteado pelo Geos?

  • O Genie está implantado nos EUA, na UE, na Austrália e na Índia.

  • O roteamento de tráfego depende de sua região e se o processamento entre geografias está ativado (Enforce data processing within workspace Geography for Designated service is Disabled ):

    • UE : O tráfego sempre percorre a UE, independentemente do processamento entre regiões geográficas.

    • EUA : O tráfego sempre passa pelos EUA, independentemente do processamento entre regiões geográficas.

    • Índia e AUS :

      • Se o processamento entre regiões geográficas estiver desativado : é garantido que o tráfego permaneça na sua região.
      • Se o processamento geográfico cruzado estiver ativado : o tráfego sempre percorre os EUA.
    • Todas as outras regiões :

      • Se o processamento cruzado de dados geográficos estiver desativado : O Genie não funcionará.
      • Se o processamento geográfico cruzado estiver ativado : rotas de tráfego pelos EUA.