Jarvanen

Results 4 issues of Jarvanen

微调数据的一条记录中,可以有多个问答对,这个问答对的长度是多少比较合适呢? 我的数据中有些问答对有十几二十轮对话,最后微调的效果不太好,比一问一答的差些。

### System Info / 系統信息 xinference 1.11.0 ### Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece? - [ ] docker / docker - [x] pip install / 通过 pip...

### System Info / 系統信息 xinference v1.11.0.post1 ### Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece? - [ ] docker / docker - [x] pip install / 通过 pip...

使用的runtime中fastapi启动服务,模型加载时设置了load_trt=True, load_vllm=True 调用方法model_output = cosyvoice.inference_zero_shot(tts_text, "", "", zero_shot_spk_id=zero_shot_spk_id) 30个字符的内容并发10要十秒钟,这正常吗 感觉有点慢,10个字符10并发要4秒