Pular para o conteúdo principal

texto (DataStreamReader)

Carrega um arquivo de texto transmissão e retorna um DataFrame cujo esquema começa com uma coluna de strings chamada value, seguida por quaisquer colunas particionadas. Os arquivos de texto devem ser codificados em UTF-8. Por default, cada linha no arquivo de texto corresponde a uma nova linha no DataFrame resultante.

Sintaxe

text(path, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

str

Caminho para a entrada de texto.

Devoluções

DataFrame

Exemplos

Carregue uma transmissão de um arquivo de texto temporário:

Python
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="text") as d:
spark.createDataFrame(
[("hello",), ("this",)]).write.mode("overwrite").format("text").save(d)
q = spark.readStream.text(d).writeStream.format("console").start()
time.sleep(3)
q.stop()