StrugglingForBetter
StrugglingForBetter
> 我发现了一个问题。 > > [config.yaml](https://github.com/alibaba/MNN/blob/1.1.7/tools/MNNPythonOfflineQuant/config.yaml)中写的是shape:(1, 3, 224,224), formats:(nchw) > > 但是在[calibration_dataset.py](https://github.com/alibaba/MNN/blob/master/tools/MNNPythonOfflineQuant/calibration_dataset.py)的84行写的却是(1, 224, 224, 3),以及F.data_format.NHWC。 正好相悖了。 > > 请问这是demo给错了还是本身就应该这样呢 请问是一定要这样才能跑成功吗?如果不这样是不是不能成功?我这边有和你类似的情况,但是一直没有跑成功
> > 知道这个错误的原因了,当输入图片的大小是 3000*4000时, [1,3,1,1,16] 张量和[1,3,3000,4000,16]的张量计算乘法时,内存出现了错误。 > > 期望能把内存这块的在优化一下 请问最后解决了吗?用什么办法解决? 还是说对于大输入的模型,有更适合的框架吗? 求解+1
就是在scripts/build_msvc_native.bat里面加了-DTNN_OPENMP_ENABLE=ON
你好!感谢回复!环境就是win10+vs2019。 请问可以给我其他更加便捷的联系方式吗?这样有利于及时交流。另外一方面也可以更加方便的传给你模型。谢谢!
> 1. 请问下有尝试过使用TNNTest测试一些基础的网络(mobilenet, squeezenet之类)吗?运行完scripts/build_msvc_native.bat后会编译出TNNTest测试工具,然后例如执行 > ./TNNTest -mp mobilenetv2.tnnproto -dt X86 -ic 10 -th 4 > 通过-th 4指定4线程,测试一下是否有多线程加速。 > 2. 如果上述方式能观察到多线程加速效果,但是切换到你们自己的模型却没有加速,可以提供一下tnnproto模型文件。 > 3. 如果上述方式也没有观察到多线程加速效果,麻烦提供一下编译环境信息,例如win10 + vs2019之类,我尝试复现一下。 @powerpwang 我这边做了测试,最后出来结果有点难以想象,我分别测试了th = 1, th=...
@powerpwang 另外这里还有 th = 8的结果: TNN Benchmark time cost: min = 48603.375 ms | max = 49630.074 ms | avg = 48852.613 ms 看起来,线程越多反而越慢
业务场景:计算机视觉领域 部署场景: 部署到X64,Win10
> This is usually related to incorrect CUDA and cuDNN versions. Hi, Thanks for your reply. I emailled you but my email was rejected automatically. I don't know why. For...
同关注这个问题,请问有思路分享吗?
Is there anybody who can hlep use with this issue?