RAG-Retrieval
RAG-Retrieval copied to clipboard
关于负例挖掘
我将embedding进行了聚类,筛选出了分类错误的query作为负例,进行微调。。。效果比微调前差了好多。。。关于负类挖掘,有什么建议吗,还是说自动负例为空,让他采样排名较后的top项就能获得比较好的效果呢? embedding模型的微调是否也需要混合一定比例通用数据(或者说模型本身区分度表现挺好的数据)来降低能力的损害?