james016

Results 2 issues of james016

I bumped into `RecursionError` in the `deepcopy` reproduced by ``` import sys from matching.games import StableMarriage # fix by enlarging the size of recursionlimit # sys.setrecursionlimit(10000) num_x = 400 num_y...

longterm

您好,我正在分析 C-MTEB/CmedqaRetrieval 数据集中的一些异常情况,并注意到某些 ground truth 结果似乎与我的常识不符。为了更好地理解这些异常,我想了解数据集的生成过程,特别是以下几点: 1. **数据集构建流程**:数据集是如何从原始数据中提取出 4000 个查询和相应的语料库(大约 7500+ 条目)的? 2. **相似问题的处理**:在处理 4000 个查询时,是否有对相似问题进行清洗或标注? 3. **负样本的选取**:负样本(与查询无关的样本)是如何选取的?是否主要来自网络搜索内容? 我希望通过了解这些信息,能更准确地判断数据集中是否存在标签错误或其他问题。 ## 细节 我验证文献引用的链条 https://arxiv.org/pdf/2309.07597.pdf -> https://arxiv.org/pdf/2203.10232.pdf -> https://github.com/zhangsheng93/cMedQA2 -> https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8548603 找到原始的文章好像是...