ms-swift icon indicating copy to clipboard operation
ms-swift copied to clipboard

微调qwen后会循环输出

Open sherry085 opened this issue 1 year ago • 8 comments

image image Uploading image.png…

sherry085 avatar May 27 '24 11:05 sherry085

多训练几个epoch. 你现在是微调了几个epoch

Jintao-Huang avatar May 27 '24 14:05 Jintao-Huang

多训练几个epoch. 你现在是微调了几个epoch @Jintao-Huang 您好,感谢解答。我是针对一个自定义数据集(56个问答对)加上自我认知,以及两个开源进行微调的, image 我尝试了微调1~3个epoch,学习率和warm_up尝试了两组,[learning_rate=1e-4,warmup_ratio=0.03], [learning_rate=5e-5, warmup_ratio=0.4,]自我认知和其他问题回答都没有问题,只针对自定义(tab_des)会出问题,一是重复输出,二是没有学习到这个表,回答说不知道。

sherry085 avatar May 28 '24 03:05 sherry085

我多训几个轮次后,有效果

hl-gl avatar May 29 '24 02:05 hl-gl

我多训几个轮次后,有效果

@liuhuan-gl 你好,想请教下你的数据集体量和训练轮数,我试了5轮还是不太行,有时候不循环了,但是胡说八道,问数据集里的原问题都答不上来,只有自定义数据集出问题,其他数据集(如自我认知)相关的问题没什么问题。

sherry085 avatar May 29 '24 02:05 sherry085

我刚开始训练1轮测试结果和你的问题一样,也会重复,1200组对话,然后训练了110轮次效果好了很多

hl-gl avatar May 29 '24 02:05 hl-gl

我刚开始训练1轮测试结果和你的问题一样,也会重复,1200组对话,然后训练了110轮次效果好了很多 @liuhuan-gl 谢谢你的解答~不过110轮会不会过拟合,出现基础知识的遗忘呀

sherry085 avatar May 29 '24 02:05 sherry085

也许会,我还没测试其余数据,测完以后告诉你

hl-gl avatar May 29 '24 02:05 hl-gl

也许会,我还没测试其余数据,测完以后告诉你

好呀,谢谢 @liuhuan-gl

sherry085 avatar May 29 '24 02:05 sherry085