Shen
Shen
As describeed in blog-2024-05-25(https://llava-vl.github.io/blog/2024-05-25-llava-next-ablations/), higher-AnyRes is proposed to avoid the loss of detail for high-resolution images. Where can I find the **code of** **higher-AnyRes image dividing method** and the **thresholded...
chartQA数据集的test集中有chartqa_test_human 和 chartqa_test_augmented两个子集,请问internVL在评测时用的是哪一个子集,谢谢!
我在论文里https://arxiv.org/abs/2412.05271这篇论文里注意到AI2D有两个评价分数,分别是w M(with mask) 和 wo M(without mask)。 请教一下, internvl模型在AI2D上的评测是否采用和vlmevalkit同样的方法,在图片中加入选项的字母?这种方式对应with mask 和 without mask的哪一种? 感谢对开源工作的贡献,期待解答。