ChatTTS icon indicating copy to clipboard operation
ChatTTS copied to clipboard

作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段听起来低沉一些

Open xiaoxiaotestnote opened this issue 1 year ago • 3 comments

作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段就肯能低沉一些,这个有什么优化的方法吗?

xiaoxiaotestnote avatar Aug 29 '24 07:08 xiaoxiaotestnote

音色没固定

heart18z avatar Aug 30 '24 01:08 heart18z

音色没固定

那如何固定呢?音色听起来是一个人,就是感觉声音的空间不一样

xiaoxiaotestnote avatar Aug 30 '24 09:08 xiaoxiaotestnote

这是模型自身的问题导致的,原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。

fumiama avatar Aug 30 '24 09:08 fumiama

This issue was closed because it has been inactive for 15 days since being marked as stale.

github-actions[bot] avatar Nov 21 '24 04:11 github-actions[bot]