ai_extract
AI/LLM を使用して、ドキュメント列から構造化データを抽出します。
対応するDatabricks SQL関数については、ai_extract関数を参照してください。
構文
Python
from pyspark.sql import functions as dbf
dbf.ai_extract(col=<col>, schema=<schema>, options=<options>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 抽出するドキュメントコンテンツを含む列。 |
|
| Pythonの辞書(フィールド名から |
|
| 抽出動作を制御するオプションのディクショナリ。 |
戻り値
pyspark.sql.Column抽出されたフィールドを含む VariantType の新しい列。
例
Python
df.select(ai_extract("text", {"name": {"type": "string", "description": "Name"}}))
df.select(ai_extract("text", ["name", "age"]))