nihui
nihui
imx6d 单线程耗时 | fp32 | int8 -- | -- | -- 30层rnn | 1392.22 | 504.83 30层lstm | 6063.91 | 1833.46 30层gru | 4357.59 | 1300.93
> ## error log | 日志或报错信息 | ログ > ``` > 已崩溃:com.o.FaceDetectQueue > EXC_BAD_INSTRUCTION 0x00000000d5380000 > > Crashed: com.o.FaceDetectQueue > 0 iOS_Wallet 0x15050 ruapu_some_cpuid() + 6 > 1 iOS_Wallet 0x15108...
https://github.com/Tencent/ncnn/pull/5435
implemented in https://github.com/Tencent/ncnn/commit/08b7d99a75ad70fdc5c1d9e5debc675fce5e83a9
可以 extract 中间层的输出,检查是哪个层开始发生数据异常
推荐使用pnnx转换模型 https://github.com/pnnx/pnnx
> > 推荐使用pnnx转换模型 https://github.com/pnnx/pnnx > > @nihui 我试了pnnx,结果和onnx转ncnn的结果一样。 > > 顺便问个问题,pytorch模型要求输入维度是CHW,但是输入bmp的buffer是HWC的分布,这里是否需要做维度转换?在ncnn的sample里没有看到转换的例子。 > > ``` > cv::Mat m = cv::imread(“test.bmp”); > ncnn::Mat in = ncnn::Mat::from_pixels_resize(m.data, ncnn::Mat::PIXEL_BGR, nWidth, nHeight, 224, 224); >...
https://github.com/Tencent/ncnn/pull/5328
You can skip building tools via cmake option `-DNCNN_BUILD_TOOLS=OFF` and use the prebuilt pnnx tools here for converting torch model to ncnn ---> https://github.com/pnnx/pnnx
trace 的模型支持动态长度序列输入的 你还可以在pnnx转换时指定 inputshape2 来指派动态的维