Pular para o conteúdo principal

documento de análise de IA

Analisa uma coluna contendo dados binários (blob) e retorna um VariantType. Lança uma exceção se o blob de entrada for inválido.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou dados binários

Uma coluna ou nome de coluna contendo os blocos binários a serem analisados.

options

dict, opcional

Um dicionário de opções para controlar o comportamento da análise sintática.

Devoluções

pyspark.sql.ColumnUma nova coluna do tipo VariantType contendo o resultado da análise do documento. O resultado inclui um objeto document com arrays pages e elements , juntamente com error_status e metadata. Cada elemento representa uma unidade discreta de conteúdo dentro do documento analisado, como um parágrafo de texto, uma tabela, uma figura ou um marcador de vista. Para obter o esquema de saída completo e detalhes sobre os elementos, consulte ai_parse_document.