Análise de Documentos
A Análise de Documentos usa técnicas de pesquisa de última geração para extrair e visualizar dados estruturados de uma ampla gama de tipos de documentos, incluindo, mas não se limitando a PDFs, imagens, documentos do Word (DOC/DOCX) e arquivos do PowerPoint (PPT/PPTX). Ele é projetado para lidar com disposições complexas, como tabelas, gráficos e conteúdo misto de texto e imagem.
A Análise de Documentos é construída sobre a função ai_parse_document e inclui uma interface de usuário que permite analisar documentos e inspecionar imediatamente sua estrutura através de texto formatado ou saídas JSON estruturadas.
Requisitos
-
Um workspace que inclui o seguinte:
- Compute serverless ativado. Consulte requisitos do compute serverless.
- Unity Catalog ativado. Consulte Ativar um workspace para o Unity Catalog.
- Acesso a uma política de uso serverless com um orçamento diferente de zero.
-
Essa função está disponível apenas em algumas regiões, consulte disponibilidade da função de AI.
- A função
ai_parse_documenttambém está disponível para workspaces com o complemento Segurança e Compliance Aprimoradas.
- A função
Analisar documentos
Use a Análise de Documentos para analisar seus documentos e visualizar sua estrutura.
- Vá para
**Agentes** no painel de navegação esquerdo do seu workspace.
- Clique em Criar Agente > Análise de Documentos .
- Selecione seu documento de origem. É possível optar por fazer o upload de um arquivo ou selecionar um de um catálogo existente do Unity Catalog. Formatos compatíveis incluem: PDF, imagens, DOC/DOCX e PPT/PPTX.
- Clique em **Analisar documento**.
A análise do seu documento pode levar alguns minutos. Quando concluído, a Análise de Documentos mostra o documento de origem à esquerda e o documento analisado à direita. É possível escolher visualizar o documento analisado como texto Formatado ou JSON Bruto .

Processar e consultar resultados
Para visualizar a consulta ai_parse_document e executá-la em mais documentos, clique em Usar Agente e escolha entre executar a consulta do Editor SQL ou do Notebook. Você pode editar a consulta para apontar para o volume ou tabela em que seus documentos estão.
Análise de documentos fornece uma interface de IU para a função SQL ai_parse_document. Consulte a página de referência ai_parse_document para mais exemplos e detalhes avançados.
Para preparar a saída analisada para recuperação (RAG), use ai_prep_search (Beta) downstream.
Limitações
Consulte limitações deai_parse_document.