DiffSynth-Studio
DiffSynth-Studio copied to clipboard
使用多卡进行 Full training,遇到 “torch.distributed.DistNetworkError: The client socket has timed out after 1800000ms while trying to connect to”的问题
这个问题有什么好的办法规避吗?
@RockyLQ1 请问是多机训练吗?使用的 GPU 是什么?
是单机多卡训练,H20机器。后来减少训练数据就没报错了。。