url_decode
'application/x-www-form-urlencoded' 形式の URL エンコードされた文字列を元の形式にデコードします。
構文
Python
from pyspark.sql import functions as sf
sf.url_decode(str)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 文字列の列。それぞれが URL エンコードされた文字列を表します。 |
戻り値
pyspark.sql.Column: 文字列の新しい列。それぞれがデコードされた文字列を表します。
例
例1 : URLエンコードされた文字列のデコード
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("https%3A%2F%2Fspark.apache.org",)], ["url"])
df.select(sf.url_decode(df.url)).show(truncate=False)
Output
+------------------------+
|url_decode(url) |
+------------------------+
|https://spark.apache.org|
+------------------------+
例2 : スペースを含むURLエンコードされた文字列のデコード
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Hello%20World%21",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| Hello World!|
+---------------+
例3 : 特殊文字を含むURLエンコードされた文字列のデコード
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("A%2BB%3D%3D",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| A+B==|
+---------------+
例4 : 非ASCII文字を含むURLエンコードされた文字列のデコード
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("%E4%BD%A0%E5%A5%BD",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| 你好|
+---------------+
例5 : URLエンコードされた文字列を16進数値でデコードする
Python
from pyspark.sql import functions as sf
df = spark.createDataFrame([("%7E%21%40%23%24%25%5E%26%2A%28%29%5F%2B",)], ["url"])
df.select(sf.url_decode(df.url)).show()
Output
+---------------+
|url_decode(url)|
+---------------+
| ~!@#$%^&*()_+|
+---------------+