vector_normalize
Normaliza um vetor float para comprimento unitário usando o grau de norma especificado. O grau tem como default 2,0 (norma euclidiana) se não especificado.
Para a função correspondente do Databricks SQL, consulte funçãovector_normalize.
Sintaxe
Python
from pyspark.sql import functions as dbf
dbf.vector_normalize(vector=<vector>, degree=<degree>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Coluna de vetor de entrada. |
|
| Grau da norma ( |
Devolve
pyspark.sql.Column: O vetor normalizado como uma matriz de floats.
Exemplos
Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField
schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([3.0, 4.0],)], schema)
df.select(dbf.vector_normalize('v', dbf.lit(2.0).cast('float'))).first()[0]
# [0.6..., 0.8...]