メインコンテンツまでスキップ

ai_classify

AI/LLMを使用して、ドキュメントコンテンツを指定されたラベルのいずれかに分類します。

対応するDatabricks SQL関数については、ai_classify関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.ai_classify(col=<col>, labels=<labels>, options=<options>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または str

分類するドキュメント コンテンツが含まれる列。

labels

listdictpyspark.sql.Column、または str

リテラルなラベルセット (Pythonのラベル文字列のリスト、またはラベル名を説明にマッピングする辞書で、自動的にJSONリテラルにシリアル化されたもの)、または行ごとの値がラベル文字列のJSON配列、またはラベル名を説明にマッピングするJSONオブジェクトである列式。

options

dict、オプション。

分類動作を制御するためのオプションのディクショナリです。

戻り値

pyspark.sql.Column分類結果を含む新しい列です。

デフォルトの動作は単一ラベル分類です。複数ラベル分類を有効にし、サポートされているすべてのオプションを表示するには、SQL 言語マニュアルを参照してください。

Python
# Static labels (same set for every row)
df.select(ai_classify("text", ["positive", "negative", "neutral"]))
df.select(ai_classify("text", {"positive": "Happy tone", "negative": "Unhappy tone"}))

# Per-row labels (a column whose value is a JSON array or JSON object string)
df.select(ai_classify("text", col("labels_json")))
このページの見出し