Pular para o conteúdo principal
Página não listada
Esta página não está listada. Mecanismos de busca não armazenarão nenhuma informação, e somente usuários que possuam o link direto poderão acessá-la

Extração de informações

info

Visualização

Este recurso está em versão prévia pública e está em conformidade com a HIPAA.

Esta página aborda a nova versão da Extração de informação. Para informações sobre a versão anterior, consulte Usar extração de informação (legado)

A Extração de Informação transforma documentos e textos não estruturados em percepções estruturadas e key, utilizando um esquema definido. Isso permite que informações incorporadas em textos não estruturados, PDFs, imagens ou tabelas sejam usadas diretamente para análise, geração de relatórios ou por agentes e aplicativos subsequentes.

Exemplos de extração de informações incluem:

  • Extraindo partes e termos legais de contratos.
  • Extraindo itens e condições de pagamento de faturas.
  • Extraindo informações key de prontuários e anotações médicas.

A extração de informações é baseada na função AI , ai_extract. A extração de informações possui uma interface visual para personalizar e otimizar a função com um esquema definido para extração.

A Extração de informação usa armazenamentodefault para armazenar transformações temporárias de dados, pontos de verificação de modelo e metadados internos que alimentam cada agente. Ao excluir um agente, todos os dados associados a ele são removidos do armazenamento default .

Requisitos

Crie um agente de extração de informações

Vá para Ícone de agentes. Agentes no painel de navegação à esquerda do seu workspace. Clique em Criar Agente > Extração de informações .

o passo 1. Selecione os dados dos quais extrair informações

  1. Selecione os arquivos ou dados dos quais deseja extrair informações. Você pode upload arquivos, selecionar um volume Unity Catalog com tipos de arquivo compatíveis ou uma tabela que contenha dados de texto.

  2. Clique em Criar agente .

o passo 2. Configure e refine seu esquema de extração

Após o processamento da extração de informações, configure e refine quais dados você deseja extrair de seus documentos.

  1. Em Configuração, defina seu esquema de extração. Existem várias maneiras de fazer isso:

    • Insira um texto em linguagem natural que descreva as informações que você deseja extrair e clique em Gerar Esquema . A função Extração de Informações gera automaticamente um esquema JSON com nomes e definições de campos para você. Edite essas descrições conforme necessário.

    • Alternativamente, clique em "Ou, definir manualmente" para definir seu esquema manualmente:

      1. Clique em Adicionar campo .
      2. Insira o nome, o tipo e a descrição do campo.
      3. Clique em Confirmar .
      4. Repita o processo para cada campo que deseja extrair.
      5. Clique em Salvar e executar extração .
    • Você também pode clicar em JSON para editar o esquema JSON diretamente. Clique em Aplicar alterações quando terminar.

    Cada vez que você atualiza seu esquema e clica em Salvar e executar a extração , o sistema atualiza o agente de extração, executa a extração e exibe os resultados para cada entrada.

  2. À esquerda, revise o documento analisado e a extração do agente. Itere os resultados da extração de duas maneiras. Primeiro, fornecendo feedback em linguagem natural para uma ou várias entradas. Isso ajustará automaticamente suas descrições de forma inteligente assim que você clicar em Salvar e executar a extração . Em segundo lugar, através da revisão manual das descrições dos esquemas. Isso entrará em vigor assim que você clicar em Salvar e executar a extração .

  3. Utilize versões para comparar ou reverter para uma configuração anterior. Clique em Versões e, em seguida, clique em Comparar para comparar a definição do esquema de uma versão anterior com a versão atual. Clique em Restaurar para restaurar uma versão anterior.

o passo 3. Use seu agente de extração

Quando estiver satisfeito com o desempenho do agente, use-o para extrair informações.

Clique em Usar Agente no canto superior direito. Você pode escolher uma das seguintes opções:

  • Execução em SQL para usar o agente para extrair informações de todos os seus dados. Isso abre uma consulta SQL que usa ai_extract para extrair informações do seu volume ou tabela usando o esquema definido. Para obter mais informações sobre como usar ai_extract em consultas SQL , consulte a funçãoai_extract.
  • Crie um pipeline declarativo Spark para implantar um pipeline ETL que seja executado em intervalos agendados para invocar seu agente em novos dados. Isso cria o pipeline declarativo LakeFlow Spark que atualiza uma tabela de transmissão com sua extração de dados. Você pode configurar o programador do pipeline para ser executado quando novos dados chegarem. Para obter mais informações sobre o pipeline declarativo LakeFlow Spark , consulte Pipeline declarativo doLakeFlow Spark.

Limitações