Ask-Anything icon indicating copy to clipboard operation
Ask-Anything copied to clipboard

如何使mvbench推理结果限定为abcd四个选项中的一个?

Open Honey-Mydear opened this issue 1 year ago • 3 comments

您好,在mvbench论文中我了解到您使用了“Best Option: (” 这样的插入语以使得模型输出为abcd选项中的一个,代码中也是这样做的。这在videochat2中可以达成限定模型输出的作用。但是在video-chatgpt以及其他视觉语言大模型中,似乎在prompt部分加入“Best Option: (” 这样的插入语之后,模型输出仍为一段话,而非一定对应abcd四个选项,导致很难单纯用accuracy作为评测模型性能的指标。请问该问题您这边是否有解决方案?谢谢!

Honey-Mydear avatar May 06 '24 02:05 Honey-Mydear

我们使用answer prompt之后,虽然其他模型输出认为一段话,但是去除了前面的空格后,第一个字符仍然是以ABCDE的选项开始的。

yinanhe avatar May 20 '24 02:05 yinanhe

直接取ABCD对应的token id的prob

xmy0916 avatar Jun 05 '24 06:06 xmy0916

把其他模型prompt上末尾的特殊token去掉,比如</s>之类的,就可以了。

qyr0403 avatar Jul 14 '24 12:07 qyr0403