sgjh666
sgjh666
您好,请问您当时对应的旧版本是回退到哪一个commit的呢,我尝试了之前的旧版本,最终训练的loss从5.2左右经过训练下降到4.0左右,但使用test生成的语音效果非常差,主要表现为幅值超限严重,请问您这边有遇到过这样的问题吗?
> > 您好,请问您当时对应的旧版本是回退到哪一个commit的呢,我尝试了之前的旧版本,最终训练的loss从5.2左右经过训练下降到4.0左右,但使用test生成的语音效果非常差,主要表现为幅值超限严重,请问您这边有遇到过这样的问题吗? > > 类似的现象,搞定了吗 我换了一个新的足够大的语料库,然后把源程序中反复读取进行数据增强的部分给去掉了,现在的效果比较正常了,推测可能是由于数据增强中的随机增益倍数太大导致的
> > > > 你现在是用的哪个版本做得 忘记了,对照这里的上传时间找的mozilla那边的git回退回去在那个时间之前的版本
> > > > > > > > > > > > > 你现在是用的哪个版本做得 > > > > > > 忘记了,对照这里的上传时间找的mozilla那边的git回退回去在那个时间之前的版本 > > 有空帮忙git branch,多谢 > > 然后你说的‘把源程序中反复读取进行数据增强的部分给去掉了‘具体指的是什么?,只是把这个计数去掉了吗 if (count*FRAME_SIZE_5MS>=10000000...
> 话说数据集换了的话,稀疏的那几个参数需要怎么配置呢,原始的话可能10个epoch就到了 我没有改其他的东西,只是把epochs调大了,因为我初始的loss会在5.2左右需要更多的轮数,不知道为什么大家的第一轮都只有3左右