particionamento.balde
Uma transformação para qualquer tipo que particiona por um hash da coluna de entrada.
nota
Esta função só pode ser usada em combinação com o método DataFrameWriterV2.partitionedBy .
Sintaxe
Python
from pyspark.sql.functions import partitioning
partitioning.bucket(numBuckets, col)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| O número de baldes. |
|
| Coluna de data ou hora de destino na qual trabalhar. |
Exemplos
Python
from pyspark.sql.functions import partitioning
df.writeTo("catalog.db.table").partitionedBy(
partitioning.bucket(42, "ts")
).createOrReplace()