xtuner icon indicating copy to clipboard operation
xtuner copied to clipboard

llava训练,一条训练输入中包含多张图片。

Open Yanllan opened this issue 1 year ago • 2 comments

请问xtuner适配一条数据中多张图片训练么?因为我看输入图片路径只有一个,可以是个列表么? 例如输入文本为:以下哪一张图片更符合香蕉的定义?A: B: 输入图片路径为['image1.jpg','image2.jpg']

Yanllan avatar Dec 29 '24 03:12 Yanllan

魔改一下xtuner的internvl dataset

xyzhu1120 avatar Jan 14 '25 04:01 xyzhu1120

请问您解决了吗,遇到了同样的需求,谢谢!

liuluhaixiu avatar Feb 23 '25 13:02 liuluhaixiu