contagem aproximada distinta
Essa função agregada retorna uma nova coluna, que estima a contagem aproximada de elementos distintos em uma coluna especificada ou em um grupo de colunas. Compatível com Spark Connect.
atenção
Obsoleto na versão 2.1.0. Use approx_count_distinct em vez disso.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.approxCountDistinct(col=<col>, rsd=<rsd>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| O rótulo da coluna na qual serão contados os valores distintos. |
|
| O desvio padrão relativo máximo permitido (default = 0,05). |
Exemplos
Veja approx_count_distinct para exemplos.