yeluoo
yeluoo
@PC-god @EvanZune 解决了吗
@happyharrycn @fmu2 @YichengWu
I wrote the LISRD code with the weights he @sanersbug provided, have you tried it? @xmba15
this is link : [https://github.com/Shiaoming/ALIKE.git](https://github.com/Shiaoming/ALIKE.git),you can try, I get bad result from your descriptor.
@huchenlei
@zengyh1900 这里的prompt是整张图对应的caption,还是mask区域对应的caption,论文似乎说的是mask区域对应的反caption,那么问题来了,prompt不是训练t2i吗,那为什么是mask区域的caption呢
> @zengyh1900 我下载的laion数据集,每一张图会对应一个json  问题1:你的laion数据集中,随机mask对应的提示词是上面json里面的caption吗? 问题2:如果是,我理解anno_info["remark"]是对应上面json,为什么prompt来自anno_info["content"],而不是来自remark 问题3:如果不是,anno_info["content"]是怎么来的,我理解随机mask对应的提示词是不是也得通过blip来获取? 问题4:可以提供几个样本和对应的annotation文件吗或者有一个文档能解释一下每一个文件的意义和构建来源,以及每一个字段的意义?方便我们清晰地知道你的数据结构是什么样的。  哈喽,你问题解决了吗,能分享一下你的数据集吗,我也遇到相同的问题
@huchenlei
@JasonGUTU