Deqiang

Results 2 issues of Deqiang

感谢做了这么好的工作。 我们用1.2 plus复现mathvista的效果,最好只有37%,跟公开的59.9%相差太远,辛苦指导下,是哪里没用对吗?

请问Multimodal Evaluation实验的结果,中文数据集上各个模型的表现,能提供下具体的指标吗。