kill_sketch_get_n_double
Retorna o número de itens coletados no esboço duplo KLL.
Sintaxe
Python
from pyspark.sql import functions as sf
sf.kll_sketch_get_n_double(col)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Representação binária de esboço duplo KLL. |
Devoluções
pyspark.sql.Column: A quantidade de itens no esboço.
Exemplos
Exemplo 1 : Obter a contagem de itens em um esboço duplo KLL
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
sketch_df = df.agg(sf.kll_sketch_agg_double("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_n_double("sketch")).show()
Output
+-------------------------------+
|kll_sketch_get_n_double(sketch)|
+-------------------------------+
| 5|
+-------------------------------+