kll_merge_agg_double
集計関数: バイナリ KllDoublesSketch 表現をマージし、マージされたスケッチを返します。オプションの k は、マージされたスケッチのサイズと精度を制御します (範囲 8 ~ 65535)。 k が指定されていない場合、マージされたスケッチは最初の入力スケッチの k 値を採用します。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.kll_merge_agg_double(col=<col>, k=<k>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| バイナリ KllDoublesSketch 表現を含む列。 |
|
| サイズと精度を制御する k 問題 (範囲 8 ~ 65535)。 |
戻り値
pyspark.sql.Column: KllDoublesSketch のマージされたバイナリ表現。
例
Python
from pyspark.databricks.sql import functions as dbf
df1 = spark.createDataFrame([1.0,2.0,3.0], "DOUBLE")
df2 = spark.createDataFrame([4.0,5.0,6.0], "DOUBLE")
sketch1 = df1.agg(dbf.kll_sketch_agg_double("value").alias("sketch"))
sketch2 = df2.agg(dbf.kll_sketch_agg_double("value").alias("sketch"))
merged = sketch1.union(sketch2).agg(dbf.kll_merge_agg_double("sketch").alias("merged"))
n = merged.select(dbf.kll_sketch_get_n_double("merged")).first()[0]
n
Output
6