BearApple-

Results 5 comments of BearApple-

大佬,master训练的时候,我一直出现loss为nan的情况,这种情况在第一个epoch就出现了,不知道是咋回事。求大佬指点迷津,感谢!

我训练master时,刚开始就出现nan,好奇怪

大佬,能提供一下训练好的模型吗,我这边训练出来的效果达不到50%,不知道是不是batchsize设置小的问题。

有的,这个需要batchsize设置小一些,如果最开始跑占用的显存是5000MB左右,最后稳定的时候是8200多MB。

我的batchsize设置为2,最终的exprate只有49%...