基数
コレクション関数: 列に格納されている配列またはマップの長さを返します。
対応する Databricks SQL 関数については、 cardinality関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.cardinality(col=<col>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| ターゲットカラムをコンピュートに。 |
戻り値
pyspark.sql.Column: 配列/マップの長さ。
例
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([1, 2, 3],),([1],),([],)], ['data'])
df.select(dbf.cardinality("data")).show()
Output
+-----------------+
|cardinality(data)|
+-----------------+
| 3|
| 1|
| 0|
+-----------------+