VisualGLM-6B icon indicating copy to clipboard operation
VisualGLM-6B copied to clipboard

有支持多轮对话finetune的实现吗?

Open CaicaiJason opened this issue 2 years ago • 10 comments

有支持多轮对话finetune的实现吗?

CaicaiJason avatar Jun 08 '23 03:06 CaicaiJason

本来就支持啊

Sleepychord avatar Jun 09 '23 04:06 Sleepychord

image 多轮对话的数据格式是什么样的?

CaicaiJason avatar Jun 09 '23 04:06 CaicaiJason

你把prompt改成"这张图片里有苹果吗?\n答:有。\n问:有几个苹果?" 把label改成"有2个。" 就相当于训练了多轮对话的第二轮

yuyijiong avatar Jun 10 '23 07:06 yuyijiong

你把prompt改成"这张图片里有苹果吗?\n答:有。\n问:有几个苹果?" 把label改成"有2个。" 就相当于训练了多轮对话的第二轮

明白了,所以多轮对话就是把历史的对话变成Prompt,下一轮回答变成label去训练,感谢大佬~~

CaicaiJason avatar Jun 14 '23 03:06 CaicaiJason

但是还是有个疑问,如果是这样的形式,那么对话轮次一多,token的数量不断累加了,感觉效率上是不是太低了。 我看到的例如llava的多轮对话数据集,其实是这样的形式,是不是更合理一些? image

你把prompt改成"这张图片里有苹果吗?\n答:有。\n问:有几个苹果?" 把label改成"有2个。" 就相当于训练了多轮对话的第二轮 但是还是有个疑问,如果是这样的形式,那么对话轮次一多,token的数量不断累加了,感觉效率上是不是太低了。 我看到的例如llava的多轮对话数据集,其实是这样的形式,是不是更合理一些? image

CaicaiJason avatar Jun 14 '23 03:06 CaicaiJason

官方能给一下多轮对话的数据格式嘛?

PangziZhang523 avatar Oct 23 '23 08:10 PangziZhang523

https://github.com/THUDM/VisualGLM-6B/blob/f4429a009ee533b76e8757dce6917fbf0b0408f9/finetune_visualglm.py#L118-L120

<img>xxx</img>问:xxx
答:xxx
问:xxx
答:xxx

1049451037 avatar Oct 23 '23 09:10 1049451037

https://github.com/THUDM/VisualGLM-6B/blob/f4429a009ee533b76e8757dce6917fbf0b0408f9/finetune_visualglm.py#L118-L120

<img>xxx</img>问:xxx
答:xxx
问:xxx
答:xxx

这样还是有前面老哥提到的问题,轮数越多越复杂了

PangziZhang523 avatar Oct 23 '23 09:10 PangziZhang523

轮数越多token越多不是很正常吗……

1049451037 avatar Oct 23 '23 10:10 1049451037

但是还是有个疑问,如果是这样的形式,那么对话轮次一多,token的数量不断累加了,感觉效率上是不是太低了。 我看到的例如llava的多轮对话数据集,其实是这样的形式,是不是更合理一些? image

你把prompt改成"这张图片里有苹果吗?\n答:有。\n问:有几个苹果?" 把label改成"有2个。" 就相当于训练了多轮对话的第二轮 但是还是有个疑问,如果是这样的形式,那么对话轮次一多,token的数量不断累加了,感觉效率上是不是太低了。 我看到的例如llava的多轮对话数据集,其实是这样的形式,是不是更合理一些? image

你也可以存成这种格式,数据集存成什么格式取决于你自己的~

1049451037 avatar Oct 23 '23 10:10 1049451037