ai_classify

AI/LLMを使用して、ドキュメントコンテンツを指定されたラベルのいずれかに分類します。

対応するDatabricks SQL関数については、ai_classify関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.ai_classify(col=<col>, labels=<labels>, options=<options>)

パラメーター

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または `str`	分類するドキュメントコンテンツが含まれる列。
`labels`	`list`、`dict`、`pyspark.sql.Column`、または `str`	リテラルなラベルセット (Pythonのラベル文字列のリスト、またはラベル名を説明にマッピングする辞書で、自動的にJSONリテラルにシリアル化されたもの)、または行ごとの値がラベル文字列のJSON配列、またはラベル名を説明にマッピングするJSONオブジェクトである列式。
`options`	`dict`、オプション。	分類動作を制御するためのオプションのディクショナリです。

パラメーター	Type	説明
`col`	`pyspark.sql.Column` または `str`	分類するドキュメントコンテンツが含まれる列。
`labels`	`list`、`dict`、`pyspark.sql.Column`、または `str`	リテラルなラベルセット (Pythonのラベル文字列のリスト、またはラベル名を説明にマッピングする辞書で、自動的にJSONリテラルにシリアル化されたもの)、または行ごとの値がラベル文字列のJSON配列、またはラベル名を説明にマッピングするJSONオブジェクトである列式。
`options`	`dict`、オプション。	分類動作を制御するためのオプションのディクショナリです。

戻り値

pyspark.sql.Column分類結果を含む新しい列です。

デフォルトの動作は単一ラベル分類です。複数ラベル分類を有効にし、サポートされているすべてのオプションを表示するには、SQL 言語マニュアルを参照してください。

例

Python
# Static labels (same set for every row)
df.select(ai_classify("text", ["positive", "negative", "neutral"]))
df.select(ai_classify("text", {"positive": "Happy tone", "negative": "Unhappy tone"}))

# Per-row labels (a column whose value is a JSON array or JSON object string)
df.select(ai_classify("text", col("labels_json")))

構文​

パラメーター​

戻り値​

例​

構文

パラメーター

戻り値

例