Wenjie Zhang

Results 121 comments of Wenjie Zhang

是的,是最近更新的,应该是 11 月份 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 日期 | 2025年12月02日 15:17 | | 收件人 | ***@***.***> | | 抄送至 | Wenjie ***@***.***>***@***.***> | | 主题...

@isdream 下载 Markdown 格的文件,看一下里面图片的链接的 IP 地址是什么,如果是 mivlus-minio 这种标识符的话,配置下环境变量 HOST_IP 为实际的 IP,应该就可以显示了

大概率是生成的过程中出错了,可以看一下日志。 很有可能是出现了 tpm 的限制,尝试使用一个小一点的文件试一下。或者换一个 tpm 更大的模型,比如 glm-4.6

你指的是这个吗? http://IP:5050/docs

你说的提示处理,应该是指大模型的预填充阶段 prefill,这个也不至于要预填充 100 多秒吧,如果真要这么久的话,这个大模型服务也算是不可用了吧😂

关于前端 fetch 超时这些,还没了解过

好问题。 能否分享一下你的工具(脱敏一下),我来测试看看。 对于关于工具那里的错误,可以在中间件中添加一个 deepagents 库中的 tool patch 什么的,这个在 deep_agent/graph.py 里面有使用示例

LightRAG 的检索直接走的是 LightRAG 的接口,可能是一些配置参数要调整?

不,我测试也是这样的,不过因为实际 agent 应用中影响不大。 检索重要的是,需要的东西有没有被查到,如果没有需要的东西,只查到的一些无关的,这就证明这个知识库没有想要的东西,说明查错知识库了。 所以这个实际上没有任何影响,在 agent 应用中,我们会给智能体提供知识库的名称和描述,智能体就会自行选择合适的知识库去检索。检索到无关的东西也没关系,换个知识库就好。 另外,刚才去看了一下 LightRAG 也没有相关的参数。所以我的建议是这个不需要做考虑