Zhong Zhang (张众)
Zhong Zhang (张众)
> 你好,我把当时进行aitz评测的相关代码拆出来,贴在这条[gist](https://gist.github.com/LukeForeverYoung/274a073ca77c9dc46022cb8cc5382223)里,可以参考一下。 感谢您提供参考源码! 代码中使用的输入在aitz的原数据基础之上有进一步的预处理,可否提供一下处理后的数据'image2bbox.jsonl'和'aitz_test_sft_fc_thought_abs_resized.jsonl',或者预处理的代码?
主要想确认一下图片resize的逻辑使用这个函数实现的吗? from qwen_vl_utils import smart_resize
> 你好,我把当时进行aitz评测的相关代码拆出来,贴在这条[gist](https://gist.github.com/LukeForeverYoung/274a073ca77c9dc46022cb8cc5382223)里,可以参考一下。 您好,是否也可以release一下Android Control的评测脚本?
> > > 你好,我把当时进行aitz评测的相关代码拆出来,贴在这条[gist](https://gist.github.com/LukeForeverYoung/274a073ca77c9dc46022cb8cc5382223)里,可以参考一下。 > > > > > > 您好,是否也可以release一下Android Control的评测脚本? > > https://gist.github.com/LukeForeverYoung/1f5d19495788de0d905c5ac6341153f5 android control的测评代码我贴在这里了 十分感谢您的回复!其中有一个关键的逻辑想和您确认一下,我看到样例数据中只给了一个candidate bbox,candidate bbox是如何获取的呢?
> 您好,请问你们复现技术报告中的81.9了吗?我按照提供的prompt仍然无法复现。 请问是否可以提供一下prompt, 'image2bbox.jsonl'文件与评估脚本? 目前我们的结果是60.72,还不确定是哪个地方没有对齐。请问你们复现的结果是多少?