kll_sketch_agg_float
Função agregada: retorna a representação binária compacta do Datasketches KllFloatsSketch construído com os valores na coluna de entrada. O parâmetro opcional k controla o tamanho e a precisão do esboço (default 200, intervalo de 8 a 65535).
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.kll_sketch_agg_float(col=<col>, k=<k>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| A coluna que contém os valores de ponto flutuante a serem agregados. |
|
| O parâmetro k controla o tamanho e a precisão (default 200, intervalo de 8 a 65535). |
Devoluções
pyspark.sql.Column: A representação binária do KllFloatsSketch.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "FLOAT")
result = df.agg(dbf.kll_sketch_agg_float("value")).first()[0]
result is not None and len(result) > 0
Output
True