vector_avg
集計関数:グループ内の浮動小数点ベクトルごとの平均を返します。すべてのベクトルは同じディメンションを持つ必要があります。
対応するDatabricks SQL関数については、vector_avg集計関数を参照してください。
構文
Python
from pyspark.sql import functions as dbf
dbf.vector_avg(col=<col>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 入力ベクトル列 |
戻り値
pyspark.sql.Column:浮動小数点の配列としての要素ごとの平均ベクトル。
例
Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField
schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0],), ([3.0, 4.0],)], schema)
df.select(dbf.vector_avg('v')).first()[0]
# [2.0, 3.0]