sysuhys
sysuhys
你好,我们参考mulit_hop_qa的数据训练了qwen2模型,但在测试的时候qwen2模型一直在重复的生成不会停止了?请问是我们参数没设置对吗?还是qwen的训练数据有变化?
 上面就是我们在测试的时候生成的结果,感觉模型无法生成终止符,一直在死循环生成。我们就是用的你们开源代码里的llama配置文件,是不是有些配置参数不一样?
你好,我采用你说的第二种方法,改为qwen2templator,但会出现很多断言(如下62行代码所示),这个断言该怎么解决?把数据删掉吗?还是要改数据中的special_token?
这个是final_input:  这个是structured_final_input: 
你好,如下是train.jsonl里messages字段的内容,跟multi_hop_qa的数据格式类似。 
暂时没有问题了,谢谢