StrugglingForBetter comments

Results 18 comments of


                                            StrugglingForBetter

MNNPythonOfflineQuant这个工具量化出来后的模型

> 我发现了一个问题。 > > [config.yaml](https://github.com/alibaba/MNN/blob/1.1.7/tools/MNNPythonOfflineQuant/config.yaml)中写的是shape:(1, 3, 224,224)， formats:（nchw） > > 但是在[calibration_dataset.py](https://github.com/alibaba/MNN/blob/master/tools/MNNPythonOfflineQuant/calibration_dataset.py)的84行写的却是（1， 224， 224， 3），以及F.data_format.NHWC。正好相悖了。 > > 请问这是demo给错了还是本身就应该这样呢请问是一定要这样才能跑成功吗？如果不这样是不是不能成功？我这边有和你类似的情况，但是一直没有跑成功

模型中常量导致的Acquire buffer size = -1237319680 的问题

> > 知道这个错误的原因了，当输入图片的大小是 3000*4000时， [1,3,1,1,16] 张量和[1,3,3000,4000,16]的张量计算乘法时，内存出现了错误。 > > 期望能把内存这块的在优化一下请问最后解决了吗？用什么办法解决？还是说对于大输入的模型，有更适合的框架吗？求解+1

SetCpuNumThreads

就是在scripts/build_msvc_native.bat里面加了-DTNN_OPENMP_ENABLE=ON

SetCpuNumThreads

你好！感谢回复！环境就是win10+vs2019。请问可以给我其他更加便捷的联系方式吗？这样有利于及时交流。另外一方面也可以更加方便的传给你模型。谢谢！

SetCpuNumThreads

> 1. 请问下有尝试过使用TNNTest测试一些基础的网络(mobilenet, squeezenet之类)吗？运行完scripts/build_msvc_native.bat后会编译出TNNTest测试工具，然后例如执行 > ./TNNTest -mp mobilenetv2.tnnproto -dt X86 -ic 10 -th 4 > 通过-th 4指定4线程，测试一下是否有多线程加速。 > 2. 如果上述方式能观察到多线程加速效果，但是切换到你们自己的模型却没有加速，可以提供一下tnnproto模型文件。 > 3. 如果上述方式也没有观察到多线程加速效果，麻烦提供一下编译环境信息，例如win10 + vs2019之类，我尝试复现一下。 @powerpwang 我这边做了测试，最后出来结果有点难以想象，我分别测试了th = 1, th=...

SetCpuNumThreads

@powerpwang 另外这里还有 th = 8的结果： TNN Benchmark time cost: min = 48603.375 ms | max = 49630.074 ms | avg = 48852.613 ms 看起来，线程越多反而越慢

onnx转paddle 报错导致模型转换不成功

业务场景：计算机视觉领域部署场景：部署到X64，Win10

Report Error: CUDNN_STATUS_BAD_PARAM

> This is usually related to incorrect CUDA and cuDNN versions. Hi, Thanks for your reply. I emailled you but my email was rejected automatically. I don't know why. For...

量化后的部署问题

同关注这个问题，请问有思路分享吗？

If there is many inputs, how to write input?

Is there anybody who can hlep use with this issue?