ustcxiexk

Results 6 comments of ustcxiexk

> 使用 torchrun 分布式启动 感谢大佬回复! 能否再具体说明下步骤,要先改造下main.py为分布式,然后执行sh train.sh,再用torchrun分布式启动么?感谢大佬!!

> @ustcxiexk 试试这样: https://github.com/THUDM/ChatGLM-6B/pull/1173/files 感谢大佬!可以了,太厉害了!

> > > 使用 torchrun 分布式启动 > > > > > > 感谢大佬回复! 能否再具体说明下步骤,要先改造下main.py为分布式,然后执行sh train.sh,再用torchrun分布式启动么?感谢大佬!! > > https://github.com/THUDM/ChatGLM-6B/blob/main/ptuning/trainer.py#L1532 从官方默认的代码可以看到,只有training arg参数中local_rank!=-1的时候,才会启动ddp 应该是你的某个设置影响了训练参数中的设置,如果你没有多卡运行的需求,尝试手动设置命令行参数`--local_rank -1`试一下 感谢大佬回复,我按下面老哥提供的方案成功了,训练很慢,昨天下午到今天才训了一半,等完成了我再试试这种方法~

> Same error in runpod And generate only random img like "Batch count" Holly, I just realized I hadn't updated the version :D Does it work? I have updated sd-webui-animatediff,...

This solves the problem: https://github.com/continue-revolution/sd-webui-animatediff/issues/379