vector_normalize
指定されたノルム次数を使用して、浮動小数点ベクトルを単位長に正規化します。指定がない場合は、次数はデフォルトで2.0(ユークリッドノルム)になります。
対応するDatabricks SQL関数については、vector_normalize関数を参照してください。
構文
Python
from pyspark.sql import functions as dbf
dbf.vector_normalize(vector=<vector>, degree=<degree>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 入力ベクトル列 |
|
| ノルム次数(L1の場合は |
戻り値
pyspark.sql.Column: The normalized vector as an array of floats.
例
Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField
schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([3.0, 4.0],)], schema)
df.select(dbf.vector_normalize('v', dbf.lit(2.0).cast('float'))).first()[0]
# [0.6..., 0.8...]