Análise de Documentos
A Análise de Documentos utiliza técnicas de pesquisa de ponta para extrair e visualizar dados estruturados de uma ampla variedade de tipos de documentos, incluindo, entre outros, PDFs, imagens, documentos do Word (DOC/DOCX) e arquivos do PowerPoint (PPT/PPTX). Ele foi projetado para lidar com layouts complexos, como tabelas, gráficos e conteúdo misto de texto e imagem.
A análise de documentos é baseada na função ai_parse_document e inclui uma interface de usuário que permite analisar documentos e inspecionar imediatamente sua estrutura por meio de texto formatado ou saídas JSON estruturadas.
Requisitos
Analisar documentos
Utilize a Análise de Documentos para analisar seus documentos e visualizar sua estrutura.
- Vá para
Agentes no painel de navegação à esquerda do seu workspace.
- Clique em Criar Agente > Análise de Documentos .
- Selecione o documento de origem. Você pode optar por upload um arquivo ou selecionar um de um catálogo existente Unity Catalog . Os formatos suportados incluem: PDF, imagens, DOC/DOCX e PPT/PPTX.
- Clique em Analisar documento .
A análise do seu documento pode levar alguns minutos. Ao concluir, a Análise de Documentos exibe o documento original à esquerda e o documento analisado à direita. Você pode optar por view o documento analisado como texto formatado ou JSONbruto .

Processar e consultar resultados
Para view a consulta ai_parse_document e executá-la em mais documentos, clique em Usar Agente e escolha executar a consulta a partir do Editor SQL ou Notebook. Você pode editar a consulta para apontar para o volume ou tabela onde seus documentos estão localizados.
A análise de documentos fornece uma interface de usuário para a função SQL ai_parse_document. Consulte a página de referência ai_parse_document para exemplos e detalhes mais avançados.