kll_sketch_agg_double
Função agregada: retorna a representação binária compacta do Datasketche KllDoublesSketch construído com os valores na coluna de entrada. O parâmetro opcional k controla o tamanho e a precisão do esboço (default 200, intervalo de 8 a 65535).
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.kll_sketch_agg_double(col=<col>, k=<k>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| A coluna que contém valores duplos a serem agregados. |
|
| O parâmetro k controla o tamanho e a precisão (default 200, intervalo de 8 a 65535). |
Devoluções
pyspark.sql.Column: A representação binária do KllDoublesSketch.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
result = df.agg(dbf.kll_sketch_agg_double("value")).first()[0]
result is not None and len(result) > 0
Output
True