nihui comments

Results 477 comments of


                                            nihui

[WIP] rnn/lstm/gru dynamic quantization

imx6d 单线程耗时 | fp32 | int8 -- | -- | -- 30层rnn | 1392.22 | 504.83 30层lstm | 6063.91 | 1833.46 30层gru | 4357.59 | 1300.93

iPhone创建ncnn::net崩溃

> ## error log | 日志或报错信息 | ログ > ``` > 已崩溃：com.o.FaceDetectQueue > EXC_BAD_INSTRUCTION 0x00000000d5380000 > > Crashed: com.o.FaceDetectQueue > 0 iOS_Wallet 0x15050 ruapu_some_cpuid() + 6 > 1 iOS_Wallet 0x15108...

rnn(lstm，gru)，解卷积的量化以及增加weight only的量化

https://github.com/Tencent/ncnn/pull/5435

rnn(lstm，gru)，解卷积的量化以及增加weight only的量化

implemented in https://github.com/Tencent/ncnn/commit/08b7d99a75ad70fdc5c1d9e5debc675fce5e83a9

arm端运行出现-nan的问题

可以 extract 中间层的输出，检查是哪个层开始发生数据异常

resnet模型推理结果不准

推荐使用pnnx转换模型 https://github.com/pnnx/pnnx

resnet模型推理结果不准

> > 推荐使用pnnx转换模型 https://github.com/pnnx/pnnx > > @nihui 我试了pnnx，结果和onnx转ncnn的结果一样。 > > 顺便问个问题，pytorch模型要求输入维度是CHW，但是输入bmp的buffer是HWC的分布，这里是否需要做维度转换？在ncnn的sample里没有看到转换的例子。 > > ``` > cv::Mat m = cv::imread(“test.bmp”); > ncnn::Mat in = ncnn::Mat::from_pixels_resize(m.data, ncnn::Mat::PIXEL_BGR, nWidth, nHeight, 224, 224); >...

nihui

[WIP] rnn/lstm/gru dynamic quantization

iPhone创建ncnn::net崩溃

rnn(lstm，gru)，解卷积的量化以及增加weight only的量化

rnn(lstm，gru)，解卷积的量化以及增加weight only的量化

arm端运行出现-nan的问题

resnet模型推理结果不准

resnet模型推理结果不准

AddVectoredExceptionHandler and RemoveVectoredExceptionHandler cannot be used under uwp

clang: error: linker command failed with exit code 1

您好作者现在有很多需要动态序列化输入的模型算法，但是pnnx只支持torch.jit.trace吗固定的输入，有别的方法出路吗