MOSS-TTSD icon indicating copy to clipboard operation
MOSS-TTSD copied to clipboard

音色突变问题

Open ruby11dog opened this issue 5 months ago • 2 comments

非常好的工作!不过我在SFT模型,推理的时候,还是偶尔会遇到音色突变的问题。想问一下,你们后续解决这个问题的思路是怎么样的呢?期待回复

ruby11dog avatar Aug 22 '25 09:08 ruby11dog

Hi, 感谢关注!

我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循,目前正在测试新的Decoder~

xiami2019 avatar Aug 27 '25 01:08 xiami2019

Hi, 感谢关注!

我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循,目前正在测试新的Decoder~

是指codec的decoder部分吗?还是指llm的decoder呢?

ruby11dog avatar Sep 02 '25 09:09 ruby11dog