AgentBench icon indicating copy to clipboard operation
AgentBench copied to clipboard

Would llama3 wizardlm2 and other latest models be tested and published in leaderboard? 请求添加llama3 wizardlm等24年4-5月大模型的测试结果

Open dercaft opened this issue 1 year ago • 3 comments

请求添加llama3 wizardlm等24年4-5月大模型的测试结果。 当前的leaderboard榜单里的大模型感觉有点过时了,请问贵团队有计划测试24年最新的一批大模型吗?

dercaft avatar May 11 '24 07:05 dercaft

hi AgentBench最新结果可以在https://fm.ai.tsinghua.edu.cn/superbench/#/leaderboard 这里找到

zhc7 avatar May 25 '24 07:05 zhc7

@zhc7 superbench少了一个任务集,Digital Card Game

minleminzui avatar Jul 09 '24 09:07 minleminzui

@zhc7 superbench少了一个任务集,Digital Card Game

hi @minleminzui , 抱歉,现在在维护superbench的并不是我们,card game因为一些考虑最终没有出现,具体原因可以联系SuperBench团队。

zhc7 avatar Jul 09 '24 12:07 zhc7