Pular para o conteúdo principal

xml (DataFrameReader)

Carrega um arquivo XML e retorna o resultado como um DataFrame. Se schema não for especificado, esta função lê a entrada uma vez para determinar o esquema de entrada.

Sintaxe

xml(path, schema=None, **options)

Parâmetros

Parâmetro

Tipo

Descrição

path

string, lista ou RDD

Um ou mais caminhos de entrada, ou um RDD de strings armazenando linhas XML.

schema

StructType ou str, opcional

Um esquema de entrada opcional como um objeto StructType ou strings formatadas em DDL (por exemplo, 'col0 INT, col1 DOUBLE').

Devoluções

DataFrame

Exemplos

Escreva um DataFrame em um arquivo XML e leia-o de volta.

Python
import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

spark.read.option("rowTag", "person").xml(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+