leileilei2000

Results 18 issues of leileilei2000

sr_loss = 0.1*(torch.nn.L1Loss()(output_sr[:,0:3,:,:,],image)+torch.nn.L1Loss()(output_sr[:,3:,:,:,],ir_image[:,0:1,:,:,])) 请问output_sr、image、ir_image是在哪里引入的?我没有找到具体的位置 我在上面找到了pred,output_sr,_ = model(imgs,irs,opt.input_mode),但是model有好多个我不知道具体是哪个,所以找不到output_sr和imgs,irs的值是什么

请问构造损失中的输入图像X具体是哪部分的输入,是最初的原始输入经过多模态融合后的,还是encoder的输入高低级特征

![Snipaste_2024-01-21_16-48-11](https://github.com/icey-zhang/SuperYOLO/assets/144891526/3f326220-94da-40c6-b88b-75e4bf948bac) 1.我的疑问是如果删除了medium和large对应的concat部分,只保留small特征图,这里不应该只有一个输出y吗? 2.对应的,我也有疑问,损失函数中的l(小L)不应该也是只有一层吗 ![Snipaste_2024-01-21_21-41-58](https://github.com/icey-zhang/SuperYOLO/assets/144891526/fa9e0eea-32b8-44fc-bb90-56fa2ab60b53) 所以我认为如果是在【多模态】输入的情况下,并且只保留small特征图的情况下,网络中只剩有FPN结构,并没有PANet结构。 但是在【单模态】输入下我提出的所有疑问都将解决,1.会有3个y。 2.也会有3层,并且结构依然是PANet。 我想请问您,我的观点是否正确,请您解答。

直接运行会出现,OSError: cannot write mode F as PNG; 当修改image_read的mode为RGB或YCrCb时会出现ValueError: too many values to unpack (expected 2)

class Add2(nn.Module): # x + transformer[0] or x + transformer[1] def __init__(self, c1, index): super().__init__() self.index = index def forward(self, x): if self.index == 0: return torch.add(x[0], x[1][0]) elif self.index...