sysuhys

Results 6 comments of sysuhys

你好,我们参考mulit_hop_qa的数据训练了qwen2模型,但在测试的时候qwen2模型一直在重复的生成不会停止了?请问是我们参数没设置对吗?还是qwen的训练数据有变化?

![image](https://github.com/user-attachments/assets/67305620-efbe-4a3d-aa2a-d733c19cc04c) 上面就是我们在测试的时候生成的结果,感觉模型无法生成终止符,一直在死循环生成。我们就是用的你们开源代码里的llama配置文件,是不是有些配置参数不一样?

你好,我采用你说的第二种方法,改为qwen2templator,但会出现很多断言(如下62行代码所示),这个断言该怎么解决?把数据删掉吗?还是要改数据中的special_token?

这个是final_input: ![image](https://github.com/user-attachments/assets/5607adb5-23cd-4d3f-87a0-b4f16fe6727f) 这个是structured_final_input: ![image](https://github.com/user-attachments/assets/42f938b2-d676-45ff-a9b3-82ebefc79fe0)

你好,如下是train.jsonl里messages字段的内容,跟multi_hop_qa的数据格式类似。 ![image](https://github.com/user-attachments/assets/e81726f9-8cf1-4644-a58c-7c0a6bc59cc1)

暂时没有问题了,谢谢