structured_data_extraction_spark_udf