xuemo188
xuemo188
谢谢您在百忙之中对我问题的回答 我还有一点不清楚 在损失函数里面好像没有体现出来啊  
在训练的过程中,loss好像没有出现L1正则化的项
非常感谢您对我问题的回答,非常友好的博主 我还想请教您以下,对BN层L1正则化的过程,只是对反向调整参数  不需要改动loss是这样的吗 
 我理解的L1正则化是这样
您好,我想问一个问题,为什么BN层中的缩放因子越大,该通道参数越重要呢?论文里面好像没有体现
大佬我想问下 BN层的缩放因子越大,代表这个channel 对模型output的贡献越大这句话是为什么呢?在直观上是理解,有证明吗