Pular para o conteúdo principal

soma

Retorna a soma de todos os valores na expressão.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.sum(col)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou nome da coluna

coluna de destino para compute .

Devoluções

pyspark.sql.Column: a coluna para resultados de cálculo.

Exemplos

Exemplo 1 : Calculando a soma dos valores em uma coluna

Python
from pyspark.sql import functions as sf
df = spark.range(10)
df.select(sf.sum(df["id"])).show()
Output
+-------+
|sum(id)|
+-------+
| 45|
+-------+

Exemplo 2 : Usando uma expressão de adição para calcular a soma.

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.sum(sf.col("A") + sf.col("B"))).show()
Output
+------------+
|sum((A + B))|
+------------+
| 10|
+------------+

Exemplo 3 : Calculando a soma das idades com None

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.sum("age")).show()
Output
+--------+
|sum(age)|
+--------+
| 6|
+--------+