Wenkang Han

Results 5 comments of Wenkang Han

有计划支持三模态的全量微调吗(文本system prompt,图片,语音指令)

> @DQYZHWK 这个事情我们非常感兴趣做,但是苦于没有相应的数据,您有参考不 很抱歉,我没有相关的数据集。 https://mp.weixin.qq.com/s/hJ5x8xUstBjwNZc1mmqE-g 但是可以参考这篇文章,您可以使用VQA数据集通过tts (chattts,fishspeech)转化成SQA数据集。期待未来能集成此demo。

> 很抱歉,这样的代码也会报错 export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 export AUTO_SPLIT=1 torchrun --nproc_per_node=2 run.py --data "$data" --model Qwen2.5-VL-72B-Instruct --verbose --mode infer --reuse AUTO_SPLIT的设置只能为1嘛 我也试了 看起来只用了前两张卡,没有像python那样进行模型拆分