salvar
Salva o conteúdo de DataFrame em uma fonte de dados. A fonte de dados é especificada por format e um conjunto de options. Se format não for especificado, a fonte de dados default configurada por spark.sql.sources.default será usada.
Sintaxe
save(path=None, format=None, mode=None, partitionBy=None, **options)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| str, opcional | O caminho em um sistema de arquivos compatível com Hadoop. |
| str, opcional | O formato usado para salvar. |
| str, opcional | O comportamento quando os dados já existem. Os valores aceitos são |
| lista, opcional | Nomes das colunas de particionamento. |
| dicionário | Opções adicionais de strings. |
Devoluções
Nenhuma
Exemplos
Escreva um DataFrame em um arquivo JSON e leia-o de volta.
Python
import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").format("json").save(d)
spark.read.format('json').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+