メインコンテンツまでスキップ

vector_sum

集計関数:グループ内の浮動小数点ベクトルの要素ごとの合計を返します。すべてのベクトルは同じディメンションを持つ必要があります。

対応するDatabricks SQL関数については、vector_sum集計関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.vector_sum(col=<col>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または列名

入力ベクトル列

戻り値

pyspark.sql.Column: フロートの配列としての要素ごとの合計ベクトル。

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0],), ([3.0, 4.0],)], schema)
df.select(dbf.vector_sum('v')).first()[0]
# [4.0, 6.0]
このページの見出し