Pular para o conteúdo principal

csv (DataStreamReader)

Carrega uma transmissão de arquivo CSV e retorna o resultado como um DataFrame. Se inferSchema estiver habilitado, a função percorre a entrada uma vez para determinar o esquema. Para evitar esta passagem, desative inferSchema ou especifique o esquema explicitamente usando schema.

Sintaxe

csv(path, schema=None, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

str

Caminho para a entrada CSV.

schema

StructType ou str, opcional

Esquema como um StructType ou strings formatadas em DDL (por exemplo, col0 INT, col1 DOUBLE).

Devoluções

DataFrame

Exemplos

Carregue uma transmissão de um arquivo CSV temporário:

Python
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
q = spark.readStream.schema(
"col0 INT, col1 STRING"
).format("csv").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()