AgentBench
AgentBench copied to clipboard
Would llama3 wizardlm2 and other latest models be tested and published in leaderboard? 请求添加llama3 wizardlm等24年4-5月大模型的测试结果
请求添加llama3 wizardlm等24年4-5月大模型的测试结果。 当前的leaderboard榜单里的大模型感觉有点过时了,请问贵团队有计划测试24年最新的一批大模型吗?
hi AgentBench最新结果可以在https://fm.ai.tsinghua.edu.cn/superbench/#/leaderboard 这里找到
@zhc7 superbench少了一个任务集,Digital Card Game
@zhc7 superbench少了一个任务集,Digital Card Game
hi @minleminzui , 抱歉,现在在维护superbench的并不是我们,card game因为一些考虑最终没有出现,具体原因可以联系SuperBench团队。