メインコンテンツまでスキップ

kll_sketch_agg_float

集計関数: 入力列の値を使用して構築された Datasketches KllFloatsSketch のコンパクトなバイナリ表現を返します。オプションの k は、スケッチのサイズと精度を制御します (それでも 200、範囲は 8 ~ 65535)。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.kll_sketch_agg_float(col=<col>, k=<k>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または列名

集計する浮動小数点値を含む列。

k

pyspark.sql.Column またはint (オプション)

サイズと精度を制御する k 問題 (余裕 200、範囲 8 ~ 65535)。

戻り値

pyspark.sql.Column: KllFloatsSketch のバイナリ表現。

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1.0,2.0,3.0,4.0,5.0], "FLOAT")
result = df.agg(dbf.kll_sketch_agg_float("value")).first()[0]
result is not None and len(result) > 0
Output
True