Jingji Yu

Results 2 comments of Jingji Yu

你好,感谢提问。 Q1:我们使用的DecoupledAdamW优化器将learning rate和weight decay参数解绑了,所以weight decay需要设置更小的数值。请参考:https://github.com/mosaicml/composer/blob/dev/composer/optim/decoupled_weight_decay.py#L247 Q2:不好意思,我们目前没有打算开源训练数据集。

你好,请参考:https://github.com/DataCanvasIO/Alaya/blob/main/inferrence.py