kangguangli
kangguangli
现在的错误应该是其他地方的代码生成没有考虑到VarDesc* Attribute的情形,我们不修改op_compat.yaml,只修改op_compat_gen.py里的数据结构好了
你好,感谢您的反馈,从上面的报错暂时看不出原因。你可以设置如下flag: ```export FLAGS_call_stack_level=2``` 这可以帮我们打印C++侧报错栈,提供更多信息。 另外,也可以参考 https://www.paddlepaddle.org.cn/inference/master/guides/performance_tuning/precision_tracing.html 确认是否为某个pass的问题。 最后,可以尝试更换到2.6版本,确认问题是否存在。 如果你尝试了以上办法,请务必将运行结果贴在这里,这对我们后续的分析定位会很有帮助。
你好,现在看来应该是内部问题,有一个输入没有被初始化,我们会尽快提PR修复,合入后会及时在PR里同步。
@dict1234 #520 应该修复了,可以拉下最新代码试试。
> 你好, 我昨天也调试了一下. 挨个观察, 发现是run_mode的设置问题. 默认是paddle_gpu, 改成trt_xxx就可以了. 理论上所有run_mode应该都能跑通,现在我们已经修复了原生GPU下的问题,可以尝试下原生GPU。使用 TRT加载时间太长可能跟TRT的图优化过程有关,可以分享下你现在具体加载的用时。
原生GPU指你一开始的配置,即不使用TRT。更新的话主要更新的是本仓库,你拉下这个仓库的最新commit就行,或者手动仿照 #520 更新下 `c++/gpu/ppyoloe_crn_l/ppyoloe_crn_l.cc`即可。 关于TRT的时间问题,我会反馈给相关同事,短期内可能没法修复。