vector_l2_distance
Retorna a distância euclidiana (L2) entre dois vetores de ponto flutuante. Os vetores devem ter a mesma dimensão.
Para a função correspondente do Databricks SQL, consulte funçãovector_l2_distance.
Sintaxe
Python
from pyspark.sql import functions as dbf
dbf.vector_l2_distance(left=<left>, right=<right>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Primeira coluna vetorial. |
|
| Segunda coluna vetorial. |
Devolve
pyspark.sql.Column: distância L2 como um valor de ponto flutuante.
Exemplos
Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField
schema = StructType([StructField('a', ArrayType(FloatType())), StructField('b', ArrayType(FloatType()))])
df = spark.createDataFrame([([1.0, 2.0, 3.0], [4.0, 5.0, 6.0])], schema)
df.select(dbf.vector_l2_distance('a', 'b')).first()[0]
# 5.196152...