0x120
0x120
> else if (verInfo.dwBuildNumber == 19041) > { > pData->ver = WINVER_10_20H1; > // KP > pData->KExecOpt = 0x283; > // EP > pData->Protection = 0x87A; > pData->EProcessFlags2 = 0x9D4;...
这是pc端还是移动端
请教一个问题,我使用DouZero训练出来的掼蛋模型发现一个问题,就是训练一个月了,loss值一直在5到6之间,不下降了,而且好像还不如随机出牌这么厉害请问是哪里的问题呢
> > 请教一个问题,我用DouZero训练出来的掼蛋模型发现一个问题,就是训练一个月了,loss值一直在5到6之间,不回升了,而且好像还不如随机出牌那么厉害请问是哪里的问题呢 > > 每个人可能的原因很多。第一步都可能出问题,但是一点效果都没有,主要是这几点排查一下: > > 是否对出牌输赢奖励进行区分 是否将学习模型的状态更新到下一个出牌模型中 就是loss值不收敛,打比方刚开始训练loss在5左右,然后训练一段时间loss就在2.8到3.8之间 不会再降了