TianRuiHe

Results 1 comments of TianRuiHe

> 是不是用了 nohup? 您好,我也遇到了同样的问题,我使用了nohup进行后台挂起训练,请问这是什么原因呀 具体来说我的使用nohup在后台运行了一个使用deepspeed进行训练的代码,在运行了大概1000多个step后报错: Connection closed by localRank -1 然后就停掉了