メインコンテンツまでスキップ

vector_normalize

指定されたノルム次数を使用して、浮動小数点ベクトルを単位長に正規化します。指定がない場合は、次数はデフォルトで2.0(ユークリッドノルム)になります。

対応するDatabricks SQL関数については、vector_normalize関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.vector_normalize(vector=<vector>, degree=<degree>)

パラメーター

パラメーター

Type

説明

vector

pyspark.sql.Column または列名

入力ベクトル列

degree

pyspark.sql.Column または列名、オプション

ノルム次数(L1の場合は1.0、L2の場合は2.0、無限大ノルムの場合はfloat('inf'))。デフォルトは2.0です。

戻り値

pyspark.sql.Column: The normalized vector as an array of floats.

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([3.0, 4.0],)], schema)
df.select(dbf.vector_normalize('v', dbf.lit(2.0).cast('float'))).first()[0]
# [0.6..., 0.8...]
このページの見出し