Wei Jiang
Wei Jiang
## Describe the bug 在使用`nn.CrossEntropyLoss()`时,指定`weight`参数为`jitter.ones(num_classes, dtype='float32')`和置为`None`的运行结果不同。且指定包括全一在内的值后会带来梯度爆炸。 ## Full Log 这是指定了`weight`具体值的训练曲线。   这是不指定`weight`值的训练曲线。   ## Minimal Reproduce 数据集是CIFAR-10,简单的Conv+Linear,类似于Jittor教程的MNIST分类网络。 ## Expected behavior 希望两者训练行为至少一致,最好是都不会发生梯度爆炸。
How could I use the GRU Fusion module to feed-forwardly fuse some multiview pictures? The checkpoint `G.ckpt` seems to be somehow broken and the `representations.grufusion` is not even included in...
在点击课程后未能实现向后跳转,需修正。