kll_sketch_agg_bigint
集計関数: 入力列の値を使用して構築された Datasketches KllLongsSketch のコンパクトなバイナリ表現を返します。オプションの k は、スケッチのサイズと精度を制御します (それでも 200、範囲は 8 ~ 65535)。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.kll_sketch_agg_bigint(col=<col>, k=<k>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 集計する bigint 値を含む列。 |
|
| サイズと精度を制御する k 問題 (余裕 200、範囲 8 ~ 65535)。 |
戻り値
pyspark.sql.Column: KllLongsSketch のバイナリ表現。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1,2,3,4,5], "INT")
result = df.agg(dbf.kll_sketch_agg_bigint("value")).first()[0]
result is not None and len(result) > 0
Output
True