Pular para o conteúdo principal

estimativa de esboço de hll

Retorna o número estimado de valores únicos, dada a representação binária de um Datasketches HllSketch.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.hll_sketch_estimate(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou str

Representação binária do esboço HLL.

Devoluções

pyspark.sql.Column: O número estimado de valores únicos para o HllSketch.

Exemplos

Exemplo 1 : Estimar valores únicos a partir do esboço HLL

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([1,2,2,3], "INT")
df.agg(sf.hll_sketch_estimate(sf.hll_sketch_agg("value"))).show()
Output
+----------------------------------------------+
|hll_sketch_estimate(hll_sketch_agg(value, 12))|
+----------------------------------------------+
| 3|
+----------------------------------------------+