BearApple-
BearApple-
大佬,master训练的时候,我一直出现loss为nan的情况,这种情况在第一个epoch就出现了,不知道是咋回事。求大佬指点迷津,感谢!
我训练master时,刚开始就出现nan,好奇怪
大佬,能提供一下训练好的模型吗,我这边训练出来的效果达不到50%,不知道是不是batchsize设置小的问题。
有的,这个需要batchsize设置小一些,如果最开始跑占用的显存是5000MB左右,最后稳定的时候是8200多MB。
我的batchsize设置为2,最终的exprate只有49%...