CosyVoice icon indicating copy to clipboard operation
CosyVoice copied to clipboard

sft后的模型流式推理时存在白噪声

Open RioLLee opened this issue 8 months ago • 1 comments

5月23日版本更新删除cache flow后(版本id:3c921daede98dcaaccc17ea6fc1b74cde9549c58),使用sft后的模型进行流式推理,偶现一整个chunk的白噪声情况,其他部分正常(测试集约70条,每次推理整个测试集,都会发现这种情况的音频)。 Image

尝试把token保存,单独用flow推理,复现不了白噪声 o_o Image

之后修改完以下这行代码后,重新推理了200次,均未再出现白噪声 Image

请问下大佬们对这个bug有思绪吗

RioLLee avatar May 28 '25 07:05 RioLLee

遇到了+1

boji123 avatar May 28 '25 11:05 boji123

更新一下代码,应该是cuda stream的一些bug,具体我也不是很懂

aluminumbox avatar May 30 '25 09:05 aluminumbox

+1,遇到了经常会有一句合成的话整句话都带有电流音,删掉self.trt_context_dict[uuid]后就没有电流音了

kiraYuukiAsuna avatar Jun 10 '25 15:06 kiraYuukiAsuna