RemoteCLIP
RemoteCLIP copied to clipboard
如何获得图片划分后的每个patch的表征
作者你好,RegoinCLIP如何获取encode_image中的的[B,N_patch,768]的结果,其中B为batch_size,N_patch为划分的patch数,谢谢🙏
同问~如何获得中间层的特征
文章中计算text到image的attention map能提供一下嘛~please