MOSS
MOSS copied to clipboard
关于训练过程
我想知道,moss训练过程中一下问题:
- moss是选择哪个模型作为初始化参数(backbone)的?
- moss训练过程中用到了哪些优化显存的方法?