FastDeploy
FastDeploy copied to clipboard
trt fp16速度和fp32无差异,并没有提速
我用fastdeploy进行trt后端ppocrv4推理,结果fp32的耗时和fp16一样,是什么原有呢?
以下为我的代码:
这是结果
可能是:
- 模型较小
- trt版本较低 或 trt支持该模型的fp16算子较小