Pular para o conteúdo principal

kll_sketch_agg_float

Função agregada: retorna a representação binária compacta do Datasketches KllFloatsSketch construído com os valores na coluna de entrada. O parâmetro opcional k controla o tamanho e a precisão do esboço (default 200, intervalo de 8 a 65535).

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.kll_sketch_agg_float(col=<col>, k=<k>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

A coluna que contém os valores de ponto flutuante a serem agregados.

k

pyspark.sql.Column ou int, opcional

O parâmetro k controla o tamanho e a precisão (default 200, intervalo de 8 a 65535).

Devoluções

pyspark.sql.Column: A representação binária do KllFloatsSketch.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "FLOAT")
result = df.agg(dbf.kll_sketch_agg_float("value")).first()[0]
result is not None and len(result) > 0
Output
True