MOSS-TTSD
MOSS-TTSD copied to clipboard
音色突变问题
非常好的工作!不过我在SFT模型,推理的时候,还是偶尔会遇到音色突变的问题。想问一下,你们后续解决这个问题的思路是怎么样的呢?期待回复
Hi, 感谢关注!
我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循,目前正在测试新的Decoder~
Hi, 感谢关注!
我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循,目前正在测试新的Decoder~
是指codec的decoder部分吗?还是指llm的decoder呢?