Pular para o conteúdo principal

vector_inner_product

Retorna o produto interno (produto escalar) entre dois vetores de ponto flutuante. Os vetores devem ter a mesma dimensão.

Para a função correspondente do Databricks SQL, consulte funçãovector_inner_product.

Sintaxe

Python
from pyspark.sql import functions as dbf

dbf.vector_inner_product(left=<left>, right=<right>)

Parâmetros

Parâmetro

Tipo

Descrição

left

pyspark.sql.Column ou nome da coluna

Primeira coluna vetorial.

right

pyspark.sql.Column ou nome da coluna

Segunda coluna vetorial.

Devolve

pyspark.sql.Column: Produto interno como um valor de ponto flutuante.

Exemplos

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('a', ArrayType(FloatType())), StructField('b', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0, 3.0], [4.0, 5.0, 6.0])], schema)
df.select(dbf.vector_inner_product('a', 'b')).first()[0]
# 32.0