vector_normalize

指定されたノルム次数を使用して、浮動小数点ベクトルを単位長に正規化します。指定がない場合は、次数はデフォルトで2.0（ユークリッドノルム）になります。

対応するDatabricks SQL関数については、vector_normalize関数を参照してください。

構文

Python
from pyspark.sql import functions as dbf

dbf.vector_normalize(vector=<vector>, degree=<degree>)

パラメーター

パラメーター	Type	説明
`vector`	`pyspark.sql.Column` または列名	入力ベクトル列
`degree`	`pyspark.sql.Column` または列名、オプション	ノルム次数（L1の場合は`1.0`、L2の場合は`2.0`、無限大ノルムの場合は`float('inf')`）。デフォルトは`2.0`です。

パラメーター	Type	説明
`vector`	`pyspark.sql.Column` または列名	入力ベクトル列
`degree`	`pyspark.sql.Column` または列名、オプション	ノルム次数（L1の場合は`1.0`、L2の場合は`2.0`、無限大ノルムの場合は`float('inf')`）。デフォルトは`2.0`です。

戻り値

pyspark.sql.Column：floatの配列として正規化されたベクトルです。

例

Python
from pyspark.sql import functions as dbf
from pyspark.sql.types import ArrayType, FloatType, StructType, StructField

schema = StructType([StructField('v', ArrayType(FloatType()))])
df = spark.createDataFrame([([3.0, 4.0],)], schema)
df.select(dbf.vector_normalize('v', dbf.lit(2.0).cast('float'))).first()[0]
# [0.6..., 0.8...]

構文​

パラメーター​

戻り値​

例​

構文

パラメーター

戻り値

例