训练出现nan
你好,请问训练的时候出现这种情况怎么解决呀,我训练了两次都出现了这个问题,没有修改过代码
pytorch版本最好使用1.10
pytorch版本最好使用1.10
你好,我的环境就是1.10,测试是正常的,就是训练的时候会出现这个问题
你是几个卡训练的,也可能跟机器有关
你是几个卡训练的,也可能跟机器有关
我用单张3090的机器和4张3090的机器试过,都有这个问题。但是把self.use_augment设置成False就能正常训练,把训练第50轮的ckpt用来测试,得到的结果和论文里不使用数据增强的结果也比较接近
你是几个卡训练的,也可能跟机器有关
我用单张3090的机器和4张3090的机器试过,都有这个问题。但是把self.use_augment设置成False就能正常训练,把训练第50轮的ckpt用来测试,得到的结果和论文里不使用数据增强的结果也比较接近
请问单卡3090,bs和numworker怎么设置的,大概训了多久,谢谢
你是几个卡训练的,也可能跟机器有关
我用单张3090的机器和4张3090的机器试过,都有这个问题。但是把self.use_augment设置成False就能正常训练,把训练第50轮的ckpt用来测试,得到的结果和论文里不使用数据增强的结果也比较接近
请问单卡3090,bs和numworker怎么设置的,大概训了多久,谢谢
num_worker应该没有改,bs可能是24或者32之类的,不好意思,我毕业了没有用之前的服务器了,记不清了
你是几个卡训练的,也可能跟机器有关
我用单张3090的机器和4张3090的机器试过,都有这个问题。但是把self.use_augment设置成False就能正常训练,把训练第50轮的ckpt用来测试,得到的结果和论文里不使用数据增强的结果也比较接近
请问单卡3090,bs和numworker怎么设置的,大概训了多久,谢谢
num_worker应该没有改,bs可能是24或者32之类的,不好意思,我毕业了没有用之前的服务器了,记不清了
好的谢谢
