xtuner
xtuner copied to clipboard
llava训练,一条训练输入中包含多张图片。
请问xtuner适配一条数据中多张图片训练么?因为我看输入图片路径只有一个,可以是个列表么?
例如输入文本为:以下哪一张图片更符合香蕉的定义?A:
魔改一下xtuner的internvl dataset
请问您解决了吗,遇到了同样的需求,谢谢!