Pular para o conteúdo principal

contagem aproximada distinta

Essa função agregada retorna uma nova coluna, que estima a contagem aproximada de elementos distintos em uma coluna especificada ou em um grupo de colunas. Compatível com Spark Connect.

atenção

Obsoleto na versão 2.1.0. Use approx_count_distinct em vez disso.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.approxCountDistinct(col=<col>, rsd=<rsd>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

O rótulo da coluna na qual serão contados os valores distintos.

rsd

float, opcional

O desvio padrão relativo máximo permitido (default = 0,05).

Exemplos

Veja approx_count_distinct para exemplos.