Pular para o conteúdo principal

particionamento.balde

Uma transformação para qualquer tipo que particiona por um hash da coluna de entrada.

nota

Esta função só pode ser usada em combinação com o método DataFrameWriterV2.partitionedBy .

Sintaxe

Python
from pyspark.sql.functions import partitioning

partitioning.bucket(numBuckets, col)

Parâmetros

Parâmetro

Tipo

Descrição

numBuckets

pyspark.sql.Column ou int

O número de baldes.

col

pyspark.sql.Column ou str

Coluna de data ou hora de destino na qual trabalhar.

Exemplos

Python
from pyspark.sql.functions import partitioning
df.writeTo("catalog.db.table").partitionedBy(
partitioning.bucket(42, "ts")
).createOrReplace()