weifeng

Results 1 issues of weifeng

文章中该方法主要用在了深度神经网络方面,我想知道在transformer结构中, AdamW_GCC, AdamW_GCC2等会不会比AdamW更优秀。