eval-scope icon indicating copy to clipboard operation
eval-scope copied to clipboard

Add OpenAI health_bench support

Open bash99 opened this issue 8 months ago • 0 comments

功能描述 / Feature Description

OpenAI发布了一个 Health Bench ,并且在自己下simple_eval 里面给了调用的例子。

需求背景 / Background

这个功能有助于评测模型的医疗健康方面的能力

预期行为 / Expected Behavior

作为一个支持的eval 数据集加入

bash99 avatar May 14 '25 02:05 bash99