lvchigo
lvchigo
@dereyly I test it with my own data. It give following error: I1208 11:14:37.816094 22900 net.cpp:270] This network produces output scores I1208 11:14:37.816184 22900 net.cpp:283] Network initialization done. Loaded network...
@whhhy 同样遇到这个问题,请问,问题解决了没?如何解决的?
 - centos7.6 - hadoop3.1.0 - xlearning-gpu-1.3
@edvardHua 网络结构有6-stage改为2-stage,然后重新训练,仅此而已。。
通过打印错误日志,发现“MobilenetV2/mv2_1_max_pool“的channel为18,不能被4整除(MACE的GPU错误来源),具体错误如下: `I concat.cc:266 test/bai start I concat.cc:267 inputs_count is : 5 I tensor.h:328 Tensor MobilenetV2/mv2_0_max_pool size: [1, 24, 24, 12, ] I concat.cc:270 dim(axis_) is :12 I tensor.h:328 Tensor MobilenetV2/mv2_1_max_pool...
@qiaowei1214 问题已解决,请查看修改建议。。 建议修改“training/src/network_mv2_cpm.py”。。。
- 使用run_fsmn_ctc.sh脚本,进行模型训练;也遇到了跟题主一致的状况:在训练80个epoch后,loss仍然没有下降:最优cv_acc为41.61; - 使用run.sh 脚本,模型训练正常,loss下降正常,cv_acc提升正常; - 使用wekws版本为master分支,2024年4月8日拉取;