Pular para o conteúdo principal

url_decode

Decodifica strings codificadas em URL no formato 'application/x-www-form-urlencoded' para seu formato original.

Sintaxe

Python
from pyspark.sql import functions as sf

sf.url_decode(str)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

Uma coluna de strings, cada uma representando uma string codificada em URL.

Devoluções

pyspark.sql.ColumnUma nova coluna de strings, cada uma representando as strings decodificadas.

Exemplos

Exemplo 1 : Decodificando strings codificadas em URL

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("https%3A%2F%2Fspark.apache.org",)], ["url"])
df.select(sf.url_decode(df.url)).show(truncate=False)
Output
+------------------------+
|url_decode(url) |
+------------------------+
|https://spark.apache.org|
+------------------------+

Exemplo 2 : Decodificando strings codificadas em URL com espaços

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Hello%20World%21",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| Hello World!|
+---------------+

Exemplo 3 : Decodificando strings codificadas em URL com caracteres especiais

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("A%2BB%3D%3D",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| A+B==|
+---------------+

Exemplo 4 : Decodificando strings codificadas em URL com caracteres não ASCII

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("%E4%BD%A0%E5%A5%BD",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| 你好|
+---------------+

Exemplo 5 : Decodificando strings codificadas em URL com valores hexadecimais

Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("%7E%21%40%23%24%25%5E%26%2A%28%29%5F%2B",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| ~!@#$%^&*()_+|
+---------------+