kll_sketch_agg_bigint
Função agregada: retorna a representação binária compacta do Datasketche KllLongsSketch construído com os valores da coluna de entrada. O parâmetro opcional k controla o tamanho e a precisão do esboço (default 200, intervalo de 8 a 65535).
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.kll_sketch_agg_bigint(col=<col>, k=<k>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| A coluna que contém os valores bigint a serem agregados. |
|
| O parâmetro k controla o tamanho e a precisão (default 200, intervalo de 8 a 65535). |
Devoluções
pyspark.sql.Column: A representação binária do KllLongsSketch.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1,2,3,4,5], "INT")
result = df.agg(dbf.kll_sketch_agg_bigint("value")).first()[0]
result is not None and len(result) > 0
Output
True