hxc123fau

Results 3 comments of hxc123fau

> > > > 玩蛋,一步一步根据官方的例子微调出来的东西已经不能用了。只能回答训练时喂的数据相关问题,不能正常回答其他问题了 > > 我的跟你一摸一样的问题 > > > 玩蛋,一步一步根据官方的例子微调出来的东西已经不能用了。只能回答训练时喂的数据相关问题,不能正常回答其他问

这篇论文里《A Theoretical Analysis of the Repetition Problem in Text Generation》有讲到减小各个词汇生成的方差(字编码换成词的编码可能更好些),不过预训练好的大模型要再编码端做修改不太行,其他的话就是控制tempreture和topk那些参数了

赞一个,代码比别家要好不少