bailing
bailing copied to clipboard
.
把轻量模型下载到本地会不会更快一点 因为这个项目初衷就是能在资源受限的环境下跑 二次开发得这个项目对gpu是有要求的吧
目标是JARVIS,托尼史塔克的服务器很大,可交互入口无所不在
目标是JARVIS,托尼史塔克的服务器很大,可交互入口无所不在
我还没仔细想过诶 我原本以为把llm部署到本地开gpu响应时间就可以大幅减短了了🤯