RAG准确率实在堪忧
测试了几个手册型PDF,准确率几乎为0?尝试了不同的模型和chunking方式,依然无法检索出答案。
还行一般般,HotpotQA 数据集上最简单的模式跑分结果~ 要么是你配置有问题,要么是你手册都是图片之类的, 0% 不至于,起码知识密集型的问答不会太差。
@c121914yu 请问为啥语义检索得分更高的片段的综合排名低于前一个?
@c121914yu 请问为啥语义检索得分更高的片段的综合排名低于前一个?
问题优化会有 3-5 个检索词进行综合排名,这里只显示一个最高得分。
还行一般般,HotpotQA 数据集上最简单的模式跑分结果~ 要么是你配置有问题,要么是你手册都是图片之类的, 0% 不至于,起码知识密集型的问答不会太差。
是的,手册时图片格式的,FastGPT还不支持OCR吗?
还行一般般,HotpotQA 数据集上最简单的模式跑分结果~ 要么是你配置有问题,要么是你手册都是图片之类的, 0% 不至于,起码知识密集型的问答不会太差。
是的,手册时图片格式的,FastGPT还不支持OCR吗?
内置解析器不支持,需要配置自定义 pdf 解析器。可以参考文档里的 marker。
还行一般般,HotpotQA 数据集上最简单的模式跑分结果~ 要么是你配置有问题,要么是你手册都是图片之类的, 0% 不至于,起码知识密集型的问答不会太差。
是的,手册时图片格式的,FastGPT还不支持OCR吗?
内置解析器不支持,需要配置自定义 pdf 解析器。可以参考文档里的 marker。
maker中默认ocr也没有打开,这个应该如何配置?
maker中默认ocr也没有打开,这个应该如何配置?
你现在集成Marker不报错吗?我目前是4.9版本,实际在上传文档后调用Marker解析时一直报错