DuReader icon indicating copy to clipboard operation
DuReader copied to clipboard

是否考虑构建一个“检索+阅读”的中文openQA数据集?

Open BigHeartC opened this issue 3 years ago • 0 comments

openQA会根据问题,从知识库(百万量级以上的文本)中检索相关的文本,然后进行“阅读”以抽取出问题的答案。目前openQA的数据集主要都是英文的,如:NaturalQuestions、WebQuestions。

dureader其实可以在现有的基础上,整理出一版针对openQA任务的数据集,构建一个中文 openQA的榜单,这将对中文openQA的发展很有帮助。想问下有这个计划吗?谢谢~

BigHeartC avatar Jan 17 '23 08:01 BigHeartC