Pular para o conteúdo principal

salvar

Salva o conteúdo de DataFrame em uma fonte de dados. A fonte de dados é especificada por format e um conjunto de options. Se format não for especificado, a fonte de dados default configurada por spark.sql.sources.default será usada.

Sintaxe

save(path=None, format=None, mode=None, partitionBy=None, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

str, opcional

O caminho em um sistema de arquivos compatível com Hadoop.

format

str, opcional

O formato usado para salvar.

mode

str, opcional

O comportamento quando os dados já existem. Os valores aceitos são 'append', 'overwrite', 'ignore' e 'error' ou 'errorifexists' (default).

partitionBy

lista, opcional

Nomes das colunas de particionamento.

**options

dicionário

Opções adicionais de strings.

Devoluções

Nenhuma

Exemplos

Escreva um DataFrame em um arquivo JSON e leia-o de volta.

Python
import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").format("json").save(d)

spark.read.format('json').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+