ai_classify
AI/LLMを使用して、ドキュメントコンテンツを指定されたラベルのいずれかに分類します。
対応するDatabricks SQL関数については、ai_classify関数を参照してください。
構文
Python
from pyspark.sql import functions as dbf
dbf.ai_classify(col=<col>, labels=<labels>, options=<options>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 分類するドキュメント コンテンツが含まれる列。 |
|
| リテラルなラベルセット (Pythonのラベル文字列のリスト、またはラベル名を説明にマッピングする辞書で、自動的にJSONリテラルにシリアル化されたもの)、または行ごとの値がラベル文字列のJSON配列、またはラベル名を説明にマッピングするJSONオブジェクトである列式。 |
|
| 分類動作を制御するためのオプションのディクショナリです。 |
戻り値
pyspark.sql.Column分類結果を含む新しい列です。
デフォルトの動作は単一ラベル分類です。複数ラベル分類を有効にし、サポートされているすべてのオプションを表示するには、SQL 言語マニュアルを参照してください。
例
Python
# Static labels (same set for every row)
df.select(ai_classify("text", ["positive", "negative", "neutral"]))
df.select(ai_classify("text", {"positive": "Happy tone", "negative": "Unhappy tone"}))
# Per-row labels (a column whose value is a JSON array or JSON object string)
df.select(ai_classify("text", col("labels_json")))