微调qwen后会循环输出
多训练几个epoch. 你现在是微调了几个epoch
多训练几个epoch. 你现在是微调了几个epoch @Jintao-Huang 您好,感谢解答。我是针对一个自定义数据集(56个问答对)加上自我认知,以及两个开源进行微调的,
我尝试了微调1~3个epoch,学习率和warm_up尝试了两组,[learning_rate=1e-4,warmup_ratio=0.03], [learning_rate=5e-5, warmup_ratio=0.4,]自我认知和其他问题回答都没有问题,只针对自定义(tab_des)会出问题,一是重复输出,二是没有学习到这个表,回答说不知道。
我多训几个轮次后,有效果
我多训几个轮次后,有效果
@liuhuan-gl 你好,想请教下你的数据集体量和训练轮数,我试了5轮还是不太行,有时候不循环了,但是胡说八道,问数据集里的原问题都答不上来,只有自定义数据集出问题,其他数据集(如自我认知)相关的问题没什么问题。
我刚开始训练1轮测试结果和你的问题一样,也会重复,1200组对话,然后训练了110轮次效果好了很多
我刚开始训练1轮测试结果和你的问题一样,也会重复,1200组对话,然后训练了110轮次效果好了很多 @liuhuan-gl 谢谢你的解答~不过110轮会不会过拟合,出现基础知识的遗忘呀
也许会,我还没测试其余数据,测完以后告诉你
也许会,我还没测试其余数据,测完以后告诉你
好呀,谢谢 @liuhuan-gl