ai_extract
Extrai dados estruturados de uma coluna de documento usando AI/LLM.
Para a função correspondente do Databricks SQL, consulte funçãoai_extract.
Sintaxe
Python
from pyspark.sql import functions as dbf
dbf.ai_extract(col=<col>, schema=<schema>, options=<options>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Uma coluna que contém o conteúdo do documento de onde extrair. |
|
| Um dicionário Python (nome do campo para |
|
| Um dicionário de opções para controlar o comportamento de extração. |
Devolve
pyspark.sql.Column: Uma nova coluna de VariantType contendo os campos extraídos.
Exemplos
Python
df.select(ai_extract("text", {"name": {"type": "string", "description": "Name"}}))
df.select(ai_extract("text", ["name", "age"]))