メインコンテンツまでスキップ

約数個別

この集計関数は、指定された列または列のグループ内の要素のおおよその個別数を推定する新しい列を返します。Spark Connect をサポートします。

警告

2.1.0 では非推奨です。代わりにapprox_count_distinctを使用してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.approxCountDistinct(col=<col>, rsd=<rsd>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または列名

一意の値をカウントする列のラベル。

rsd

floatオプション

許容される最大相対標準偏差 (デフォルト = 0.05)。

例については、 approx_count_distinct を参照してください。