Pular para o conteúdo principal

xpath

Retorna uma matriz de strings com os valores presentes nos nós do XML que correspondem à expressão XPath.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.xpath(xml, path)

Parâmetros

Parâmetro

Tipo

Descrição

xml

pyspark.sql.Column ou str

Coluna XML ou nome da coluna.

path

pyspark.sql.Column ou str

Expressão XPath.

Exemplos

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[('<a><b>b1</b><b>b2</b><b>b3</b><c>c1</c><c>c2</c></a>',)], ['x'])
df.select(sf.xpath(df.x, sf.lit('a/b/text()'))).show()
Output
+--------------------+
|xpath(x, a/b/text())|
+--------------------+
| [b1, b2, b3]|
+--------------------+