hxc123fau
Results
3
comments of
hxc123fau
> > > > 玩蛋,一步一步根据官方的例子微调出来的东西已经不能用了。只能回答训练时喂的数据相关问题,不能正常回答其他问题了 > > 我的跟你一摸一样的问题 > > > 玩蛋,一步一步根据官方的例子微调出来的东西已经不能用了。只能回答训练时喂的数据相关问题,不能正常回答其他问
这篇论文里《A Theoretical Analysis of the Repetition Problem in Text Generation》有讲到减小各个词汇生成的方差(字编码换成词的编码可能更好些),不过预训练好的大模型要再编码端做修改不太行,其他的话就是控制tempreture和topk那些参数了
赞一个,代码比别家要好不少