fzcccc

Results 5 comments of fzcccc

> 是不是rerank没有释放显存导致超时了 大佬,显存是自动释放的吗,还有超时的时间可以延长吗

> 模型的注意力问题,换能力强的模型,并在提示词里约束。 也可以去优化知识库结构,比如不要直接分割,进行QA拆分,或者其他预处理。 你可以人工看下,匹配出来的知识库,是否正确匹配到了相关知识,引用的是相关+不相关,还是全部是不相关。 我用的是glm4,知识库里面的知识全部都是直接分割,有什么更强的模型推荐吗,引进来的知识是相关+不相关,最后回答的结果就会掺杂着不准确

> 我之前用过qwen2.5,模型有个bug,fastgpt自动生成的function name,比如cInBMXzQGq58,qwen2.5响应结果会改变function name导致工具调用失败,手动curl正常点的function name是没问题的,不知道你的是不是这个问题 那你说的改成非流式响应该怎么做呢

> ![image](https://private-user-images.githubusercontent.com/17702771/400699962-98342c35-9943-49b5-8ec2-d057476b8f39.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MzYyNDE5ODAsIm5iZiI6MTczNjI0MTY4MCwicGF0aCI6Ii8xNzcwMjc3MS80MDA2OTk5NjItOTgzNDJjMzUtOTk0My00OWI1LThlYzItZDA1NzQ3NmI4ZjM5LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNTAxMDclMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjUwMTA3VDA5MjEyMFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTU4OGExYWUzYWNkY2FjNjk5MmJmMzcyYzU0MDNhZWY1MDQ3Y2Y4MTYwYWQzN2MzMDllYTRhNWM0YjkxMmYxMDEmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.ywjb_DEJUNHqBOSB6KcM6R1Y0TMtgiLqlbHIo8qd5sE) 这样子配置下,不过如果ollama支持流式的话,直接使用流式方式就行吧,换个qwen2试试 老哥,我照着你的配置一模一样的去做,不管是流式还是非流式,都不行,是不是还有其他地方需要配置的

> 请问这个问题解决了吗?我使用本地ollama部署的qwen2.5模型也是这个问题,但是使用代码直接调用本地模型function call是正常的 没解决,我看最新的ollama支持流式工具调用,但是我不管流式还是非流式都没成功,不知道跟oneapi有没有关系