Wenjie Zhang

Results 20 issues of Wenjie Zhang

修改后的逻辑为: - 对于文件类型 拖拽上传之后,点击添加会进入“added”状态,此时需要点击,chunk (此时弹出弹窗,选择 chunk 的方法),点击确定之后,会被chunk为文本片段,并添加到 chunked 状态,chunk_txt 存储在数据库 json 文件中。此时的可操作按钮为【indexing, delete】,点击indexing之后会被存储到向量数据库中,状态也会更新,当然这里面是存在一些 loading、waiting 这里的中间状态。 - 新增对于网页的支持 可以添加单个网页,添加之后会自动识别标题、内容并以markdown/txt 的格式保存并展示给用户,点击确认后,进入 added 状态,文件名变成 {标题}_web.md / txt 保存到数据库中,入库之后和一般文件无异。 - 添加知识库与知识图谱构建之间的流程 - 添加文件下载按钮 -...

todo

> 此部分周期较久,8月份能完工就不错了 这里的图谱构建和 graphrag 不同。graphrag 的目的不是构建图谱,而是为了增强检索。 本项目的重点是构建高质量图谱,辅助检索是其次功能。所以尽量依赖专业的本体设计和人机交互(即可由人工手动纠正,并将纠正过程保存,作为标注数据)。 也就是可以不依赖本体设计或者专家介入,能够构建图谱。但提供基于本体好的专家介入的功能来构建更加专业的知识图谱。

在检索部分,添加混合检索。比如结合最 bm25之类的传统检索器。此部分参考 ragflow

**#️⃣ 您的功能请求是否与某个问题相关?请描述。** 目前的 OCR 基于 rapidocr_onnxruntime 推理引擎,只能在 CPU 上使用,这样固然方便项目的部署与使用,但在大量数据处理的时候会出现问题。 **#️⃣ 描述您期望的解决方案** 对于 OCR 部分考虑使用目前成熟的端到端 PDF2TXT 的解决方案,比如 [MinerU](https://github.com/opendatalab/MinerU) **#️⃣ 附加背景信息** ```python from rapidocr_onnxruntime import RapidOCR class OCRPlugin: """OCR 插件""" def __init__(self,...

enhancement

Hi, I noticed that you repeated the description of the goal here. Does this provide any performance gain? If so, roughly how much improvement does it offer? https://github.com/hhy-huang/HiRAG/blob/aaedbf955bfcf05925d9ce21ec50d3014d68b37c/hirag/prompt.py#L548-L585

### 项目地址 https://github.com/xerrors/Yuxi-Know ### 类别 人工智能 ### 项目标题 Yuxi-Know 集成知识图谱、知识库的开源智能体脚手架(适合二次开发) ### 项目描述 这是一个可以非常方便的开发自己的知识库、知识图谱、智能体的脚手架。。 为了解决自己从头开发知识库与智能体太复杂,而使用 Dify和Coze等平台,定制化程度太低,哪怕是修改小功能却不好修改。 本项目技术栈简单,前端时候Vue,后端使用FastAPI,符合 Python开发规范,代码易懂且功能强大。 如果你是公司的技术开发人员,可以很快的借助此系统开发一个内部的知识库问答平台,部分场景设计自己的智能体。 如果你是一个学生,这个项目将可以作为一个很好的练手项目,无论是学习知识图谱,还是RAG,AgenticRAG 以及智能体,都可以作为一个很好的学习资料。 ### 亮点 1. 宽松的开源协议,基于 MIT 开源协议! 2. 简单易上手,但功能强大的脚手架。(Dify部署简单,但总是大炮打蚊子,还不好改) 3. 详细的文档教程。📄[**文档中心**](https://xerrors.github.io/Yuxi-Know/)...

GitHub: https://github.com/xerrors/Yuxi-Know 这是一个可以非常方便的开发自己的知识库、知识图谱、智能体的脚手架。。 为了解决自己从头开发知识库与智能体太复杂,而使用 Dify和Coze等平台,定制化程度太低,哪怕是修改小功能却不好修改。 本项目技术栈简单,前端使用Vue,后端使用FastAPI,符合 Python开发规范,代码易懂且功能强大。 如果你是公司的技术开发人员,可以很快的借助此系统开发一个内部的知识库问答平台,部分场景设计自己的智能体。 如果你是一个学生,这个项目将可以作为一个很好的练手项目,无论是学习知识图谱,还是RAG,AgenticRAG 以及智能体,都可以作为一个很好的学习资料。 1. 宽松的开源协议,基于 MIT 开源协议! 2. 简单易上手,但功能强大的脚手架。(Dify部署简单,但总是大炮打蚊子,还不好改) 3. 详细的文档教程。📄[**文档中心**](https://xerrors.github.io/Yuxi-Know/) 哔哩哔哩观看 📽️[**视频演示**](https://www.bilibili.com/video/BV1DF14BTETq/)