Pular para o conteúdo principal

kill_sketch_get_rank_double

Extrai um valor de classificação de um esboço duplo KLL, dado um valor de quantil de entrada. O quantil pode ser um valor único ou uma matriz.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.kll_sketch_get_rank_double(sketch, quantile)

Parâmetros

Parâmetro

Tipo

Descrição

sketch

pyspark.sql.Column ou str

Representação binária de esboço duplo KLL.

quantile

pyspark.sql.Column ou str

O(s) valor(es) quantílico(s) a serem consultados.

Devoluções

pyspark.sql.Column: O(s) valor(es) de classificação (entre 0,0 e 1,0).

Exemplos

Exemplo 1 : Obter classificação a partir do esboço duplo KLL

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "DOUBLE")
sketch_df = df.agg(sf.kll_sketch_agg_double("value").alias("sketch"))
sketch_df.select(sf.kll_sketch_get_rank_double("sketch", sf.lit(3.0))).show()
Output
+---------------------------------------+
|kll_sketch_get_rank_double(sketch, 3.0)|
+---------------------------------------+
| 0.6|
+---------------------------------------+