Pular para o conteúdo principal

arquivos de entrada

Retorna um instantâneo (Snapshot) dos arquivos que compõem este DataFrame, da melhor forma possível. Este método simplesmente solicita a cada BaseRelation constituinte seus respectivos arquivos e realiza a união de todos os resultados. Dependendo das relações de origem, pode não encontrar todos os arquivos de entrada. Os itens duplicados serão removidos.

Sintaxe

inputFiles()

Devoluções

lista: Lista de caminhos de arquivos.

Exemplos

Python
import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).repartition(1).write.json(d, mode="overwrite")

df = spark.read.format("json").load(d)

if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
len(df.inputFiles())
else:
1 # dbconnect doesn't support inputFiles.
# 1