Pular para o conteúdo principal

vector_normalize

Normaliza um vetor float para comprimento unitário usando o grau de norma especificado. O grau tem como default 2,0 (norma euclidiana) se não especificado.

Para a função correspondente do Databricks SQL, consulte funçãovector_normalize.

Sintaxe

Python
from pyspark.sql import functions as dbf

dbf.vector_normalize(vector=<vector>, degree=<degree>)

Parâmetros

Parâmetro

Tipo

Descrição

vector

pyspark.sql.Column ou nome da coluna

Coluna de vetor de entrada.

degree

pyspark.sql.Column ou nome da coluna, opcional

Grau da norma (1.0 para L1, 2.0 para L2, float('inf') para norma do infinito). O default é 2.0.

Devolve

pyspark.sql.Column: O vetor normalizado como uma matriz de floats.

Exemplos

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([3.0, 4.0],)], schema)
df.select(dbf.vector_normalize('v', dbf.lit(2.0).cast('float'))).first()[0]
# [0.6..., 0.8...]