particionamento.balde

Uma transformação para qualquer tipo que particiona por um hash da coluna de entrada.

nota

Esta função só pode ser usada em combinação com o método DataFrameWriterV2.partitionedBy .

Sintaxe

Python
from pyspark.sql.functions import partitioning

partitioning.bucket(numBuckets, col)

Parâmetros

Parâmetro	Tipo	Descrição
`numBuckets`	`pyspark.sql.Column` ou int	O número de baldes.
`col`	`pyspark.sql.Column` ou str	Coluna de data ou hora de destino na qual trabalhar.

Exemplos

Python
from pyspark.sql.functions import partitioning
df.writeTo("catalog.db.table").partitionedBy(
    partitioning.bucket(42, "ts")
).createOrReplace()

Sintaxe​

Parâmetros​

Exemplos​

Sintaxe

Parâmetros

Exemplos