tensorflow-tensorrt - Databricks

import osimport pandas as pdimport shutilimport uuid  from pyspark.sql.functions import col, pandas_udf, PandasUDFTypefrom pyspark.sql.types import ArrayType, FloatType import tensorflow as tffrom tensorflow.keras.applications.resnet50 import ResNet50, preprocess_inputfrom tensorflow.python.compiler.tensorrt import trt_convert as trtfrom tensorflow.python.saved_model import signature_constants, tag_constantsfrom tensorflow.python.framework import convert_to_constants

uid = str(uuid.uuid1()) model_dir = f"/dbfs/ml/tmp/{uid}/model"trt_model_dir = f"/dbfs/ml/tmp/{uid}/trt_model"output_dbfs_dir = f"/ml/tmp/{uid}/predictions"

os.makedirs(model_dir)model = ResNet50()model.save(model_dir)

conversion_params = trt.DEFAULT_TRT_CONVERSION_PARAMSconversion_params = conversion_params._replace(precision_mode='FP16')converter = trt.TrtGraphConverterV2(        input_saved_model_dir=model_dir,        conversion_params=conversion_params,    )converter.convert()converter.save(output_saved_model_dir=trt_model_dir)

df = spark.read.format("delta").load("/databricks-datasets/flowers/delta")

def parse_example(image_data):  image = tf.image.decode_jpeg(image_data, channels=3)  image = tf.image.resize(image, [224, 224])  return preprocess_input(image)

@pandas_udf(ArrayType(FloatType()), PandasUDFType.SCALAR_ITER)def predict_batch_udf(image_batch_iter):  batch_size = 64  saved_model_loaded = tf.saved_model.load(      trt_model_dir, tags=[tag_constants.SERVING])  graph_func = saved_model_loaded.signatures[      signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY]  graph_func = convert_to_constants.convert_variables_to_constants_v2(graph_func)  for image_batch in image_batch_iter:    dataset = tf.data.Dataset.from_tensor_slices(image_batch)    dataset = dataset.map(parse_example).prefetch(512).batch(64)    prediction = []    for i, batch_images in enumerate(dataset):      batch_preds = graph_func(batch_images)[0].numpy()      prediction = prediction + list(batch_preds)    yield pd.Series(prediction)

predictions_df = df.select(col("path"), predict_batch_udf(col("content")).alias("prediction"))predictions_df.write.mode("overwrite").parquet(output_dbfs_dir)

result_df = spark.read.parquet(output_dbfs_dir)display(result_df)

shutil.rmtree("/"+model_dir, ignore_errors=True)shutil.rmtree("/"+trt_model_dir, ignore_errors=True)shutil.rmtree("/dbfs/"+output_dbfs_dir, ignore_errors=True)

tensorflow-tensorrt(Python)

Model inference using TensorRT

Prepare trained model and data for inference

Run model inference via pandas UDF