92ypli

Results 12 issues of 92ypli

call for contribution

请问下,为什么只在反向的时候对bn的scale做L1的梯度操作,然而并没有像论文提到的公式在loss有所体现? 这里有点不能理解,麻烦解惑下,谢谢!

你好,请教下,就是加入local分支训练后,相对于只用triplet loss训练原始Resnet50性能只提升一个点吗?