documento de análise de IA
Analisa uma coluna contendo dados binários (blob) e retorna um VariantType. Lança uma exceção se o blob de entrada for inválido.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.ai_parse_document(col=<col>, options=<options>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Uma coluna ou nome de coluna contendo os blocos binários a serem analisados. |
|
| Um dicionário de opções para controlar o comportamento da análise sintática. |
Devoluções
pyspark.sql.ColumnUma nova coluna do tipo VariantType contendo o resultado da análise do documento. O resultado inclui um objeto document com arrays pages e elements , juntamente com error_status e metadata. Cada elemento representa uma unidade discreta de conteúdo dentro do documento analisado, como um parágrafo de texto, uma tabela, uma figura ou um marcador de vista. Para obter o esquema de saída completo e detalhes sobre os elementos, consulte ai_parse_document.