Pular para o conteúdo principal

kll_sketch_agg_double

Função agregada: retorna a representação binária compacta do Datasketche KllDoublesSketch construído com os valores na coluna de entrada. O parâmetro opcional k controla o tamanho e a precisão do esboço (default 200, intervalo de 8 a 65535).

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.kll_sketch_agg_double(col=<col>, k=<k>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

A coluna que contém valores duplos a serem agregados.

k

pyspark.sql.Column ou int, opcional

O parâmetro k controla o tamanho e a precisão (default 200, intervalo de 8 a 65535).

Devoluções

pyspark.sql.Column: A representação binária do KllDoublesSketch.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
result = df.agg(dbf.kll_sketch_agg_double("value")).first()[0]
result is not None and len(result) > 0
Output
True