leileilei2000 issues

Results 18 issues of


                                            leileilei2000

请问MF模块的输入为什么是256尺寸的，imgsz不是1024吗？

L1loss里的输入参数问题

sr_loss = 0.1*(torch.nn.L1Loss()(output_sr[:,0:3,:,:,],image)+torch.nn.L1Loss()(output_sr[:,3:,:,:,],ir_image[:,0:1,:,:,])) 请问output_sr、image、ir_image是在哪里引入的？我没有找到具体的位置我在上面找到了pred,output_sr,_ = model(imgs,irs,opt.input_mode)，但是model有好多个我不知道具体是哪个，所以找不到output_sr和imgs,irs的值是什么

请问论文中表Ⅶ的各算法在多模态下的数据结果您是如何实现的，因为我并没有找到公开的算法代码

我有一个小问题【超分辨率损失的输入x】

请问构造损失中的输入图像X具体是哪部分的输入，是最初的原始输入经过多模态融合后的，还是encoder的输入高低级特征

【关于您论文head输出的y1，y2，y3】

![Snipaste_2024-01-21_16-48-11](https://github.com/icey-zhang/SuperYOLO/assets/144891526/3f326220-94da-40c6-b88b-75e4bf948bac) 1.我的疑问是如果删除了medium和large对应的concat部分，只保留small特征图，这里不应该只有一个输出y吗？ 2.对应的，我也有疑问，损失函数中的l（小L）不应该也是只有一层吗 ![Snipaste_2024-01-21_21-41-58](https://github.com/icey-zhang/SuperYOLO/assets/144891526/fa9e0eea-32b8-44fc-bb90-56fa2ab60b53) 所以我认为如果是在【多模态】输入的情况下，并且只保留small特征图的情况下，网络中只剩有FPN结构，并没有PANet结构。但是在【单模态】输入下我提出的所有疑问都将解决，1.会有3个y。 2.也会有3层，并且结构依然是PANet。我想请问您，我的观点是否正确，请您解答。

如何去除白边？是否有yolov5格式的标签？感谢分享！！

训练一张图像结束后，会报错OSError: cannot write mode F as PNG，并且recon文件夹下图片无法生成，只有progress文件夹有结果，之后无法训练后续图像

用simple文件运行出现一些问题

直接运行会出现，OSError: cannot write mode F as PNG；当修改image_read的mode为RGB或YCrCb时会出现ValueError: too many values to unpack (expected 2)

如果我想使用DDFM进行【可见-红外图像多模态融合的目标检测】应该如何进行？可以提供一些建议吗，感谢！

关于ADD2模型，为什么在add命令上会有不同，难道不是相同位置元素相加吗？请问为什么这样设置add

class Add2(nn.Module): # x + transformer[0] or x + transformer[1] def __init__(self, c1, index): super().__init__() self.index = index def forward(self, x): if self.index == 0: return torch.add(x[0], x[1][0]) elif self.index...