Pular para o conteúdo principal

kll_merge_agg_double

Função agregada: mescla representações binárias de KllDoublesSketch e retorna o esboço mesclado. O parâmetro opcional k controla o tamanho e a precisão do esboço de mesclagem (intervalo de 8 a 65535). Se k não for especificado, o esboço de mesclagem adota o valor de k do primeiro esboço de entrada.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.kll_merge_agg_double(col=<col>, k=<k>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

A coluna que contém representações binárias do KllDoublesSketch.

k

pyspark.sql.Column ou int, opcional

O parâmetro k controla o tamanho e a precisão (intervalo de 8 a 65535).

Devoluções

pyspark.sql.Column: A representação binária mesclada do KllDoublesSketch.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df1 = spark.createDataFrame([1.0,2.0,3.0], "DOUBLE")
df2 = spark.createDataFrame([4.0,5.0,6.0], "DOUBLE")
sketch1 = df1.agg(dbf.kll_sketch_agg_double("value").alias("sketch"))
sketch2 = df2.agg(dbf.kll_sketch_agg_double("value").alias("sketch"))
merged = sketch1.union(sketch2).agg(dbf.kll_merge_agg_double("sketch").alias("merged"))
n = merged.select(dbf.kll_sketch_get_n_double("merged")).first()[0]
n
Output
6