Sheldon
Results
1
issues of
Sheldon
按照代码里的配置完成了训练,发现过程中学习率最高只有BASE_LR参数设定的0.01,对比论文4.1节中提及的initial learning rate为0.05,请问是否应将BASE_LR修改为0.05?论文所说的initial learning rate是指warm up前第一个epoch的学习率,还是warm up后第6个epoch的最大学习率?