Pular para o conteúdo principal

carregar

Carrega dados de uma fonte de dados e os retorna como um DataFrame.

Sintaxe

load(path=None, format=None, schema=None, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

str ou lista, opcional

Um ou mais caminhos em uma fonte de dados com suporte a sistema de arquivos.

format

str, opcional

O formato da fonte de dados. O valor padrão é 'parquet'.

schema

StructType ou str, opcional

O esquema de entrada como um objeto StructType ou strings formatadas em DDL (por exemplo, 'col0 INT, col1 DOUBLE').

**options

dicionário

Opções adicionais de strings.

Devoluções

DataFrame

Exemplos

Carregar um arquivo CSV com formato, esquema e opções especificados.

Python
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)

df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+