eval-scope
eval-scope copied to clipboard
Add OpenAI health_bench support
功能描述 / Feature Description
OpenAI发布了一个 Health Bench ,并且在自己下simple_eval 里面给了调用的例子。
需求背景 / Background
这个功能有助于评测模型的医疗健康方面的能力
预期行为 / Expected Behavior
作为一个支持的eval 数据集加入