vector_avg
Função de agregação: retorna a média elemento a elemento de vetores flutuantes em um grupo. Todos os vetores devem ter a mesma dimensão.
Para a função correspondente do Databricks SQL, consulte vector_avg função de agregação.
Sintaxe
Python
from pyspark.sql import functions as dbf
dbf.vector_avg(col=<col>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Coluna de vetor de entrada. |
Devolve
pyspark.sql.Column: O vetor médio elemento a elemento como um array de floats.
Exemplos
Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField
schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0],), ([3.0, 4.0],)], schema)
df.select(dbf.vector_avg('v')).first()[0]
# [2.0, 3.0]