lvchigo

Results 7 comments of lvchigo

@dereyly I test it with my own data. It give following error: I1208 11:14:37.816094 22900 net.cpp:270] This network produces output scores I1208 11:14:37.816184 22900 net.cpp:283] Network initialization done. Loaded network...

@whhhy 同样遇到这个问题,请问,问题解决了没?如何解决的?

![xlearning-err](https://user-images.githubusercontent.com/8186051/62108495-c63dd100-b2dc-11e9-8169-34e603ddc337.png) - centos7.6 - hadoop3.1.0 - xlearning-gpu-1.3

@edvardHua 网络结构有6-stage改为2-stage,然后重新训练,仅此而已。。

通过打印错误日志,发现“MobilenetV2/mv2_1_max_pool“的channel为18,不能被4整除(MACE的GPU错误来源),具体错误如下: `I concat.cc:266 test/bai start I concat.cc:267 inputs_count is : 5 I tensor.h:328 Tensor MobilenetV2/mv2_0_max_pool size: [1, 24, 24, 12, ] I concat.cc:270 dim(axis_) is :12 I tensor.h:328 Tensor MobilenetV2/mv2_1_max_pool...

@qiaowei1214 问题已解决,请查看修改建议。。 建议修改“training/src/network_mv2_cpm.py”。。。

- 使用run_fsmn_ctc.sh脚本,进行模型训练;也遇到了跟题主一致的状况:在训练80个epoch后,loss仍然没有下降:最优cv_acc为41.61; - 使用run.sh 脚本,模型训练正常,loss下降正常,cv_acc提升正常; - 使用wekws版本为master分支,2024年4月8日拉取;