AlignBench
AlignBench copied to clipboard
为什么用GPT-4评测的时候结果会出现‘待定’
matched: '事实正确性': '待定', '满足用户需求': '待定', '清晰度': 9, '完备性': 9, '综合得分': '待定'
重新跑了一下,又没有了