Pular para o conteúdo principal

soma_de_vetores

Função de agregação: retorna a soma elemento a elemento de vetores de ponto flutuante em um grupo. Todos os vetores devem ter a mesma dimensão.

Para a função correspondente do Databricks SQL, consulte vector_sum função de agregação.

Sintaxe

Python
from pyspark.sql import functions as dbf

dbf.vector_sum(col=<col>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

Coluna de vetor de entrada.

Devolve

pyspark.sql.Column: O vetor de soma por elemento como um array de floats.

Exemplos

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0],), ([3.0, 4.0],)], schema)
df.select(dbf.vector_sum('v')).first()[0]
# [4.0, 6.0]