xuriliuhen comments

Results 7 comments of


                                            xuriliuhen

aishell3处理：使用mfa官方dict和声学模型处理aishell3

我是按照 https://montreal-forced-aligner.readthedocs.io/en/latest/first_steps/index.html#first-steps-align-pretrained 里面case3的流程跑的。最开始是拿AISHELL-3的数据集重新训练了pinyin方式的音素词典和声学模型，但是同样的对齐模型，用自己采集的中文数据集训练后的效果不清楚，没AISHELL-3数据集训练的效果好，是不是因为pinyin的对齐模型没官方提供的其他模型对齐效果好呀？

aishell3处理：使用mfa官方dict和声学模型处理aishell3

> 原作给的代码，生成的lab文件是拼音的，但是如果使用mfa官方方法直接对拼音对齐的话，由于mfa官方提供的拼音词典不正确，会导致textgrid里的phone全是spn。将生成lab文件的代码/preprocessor/preprocessor.py中的：text = text.split(" ")[1::2] 改成text = text.split(" ")[0::2] ，这样获得的lab是中文数据，再用mfa给的词典和声学模型对齐就可以了我安装你的方法跑了AISHELL3的数据集和自己采集的数据集，AISHELL3的语音合成效果要好，自己采集的数据集合成后听着很多杂音，请问这个是什么问题呢，自己的数据集本身也是在安静环境下采集并没有很多杂音的。

aishell3处理：使用mfa官方dict和声学模型处理aishell3

> > > 原作给的代码，生成的lab文件是拼音的，但是如果使用mfa官方方法直接对拼音对齐的话，由于mfa官方提供的拼音词典不正确，会导致textgrid里的phone全是spn。将生成lab文件的代码/preprocessor/preprocessor.py中的：text = text.split(" ")[1::2] 改成text = text.split(" ")[0::2] ，这样获得的lab是中文数据，再用mfa给的词典和声学模型对齐就可以了 > > > > > > 我安装你的方法跑了AISHELL3的数据集和自己采集的数据集，AISHELL3的语音合成效果要好，自己采集的数据集合成后听着很多杂音，请问这个是什么问题呢，自己的数据集本身也是在安静环境下采集并没有很多杂音的。 > > 请问这个问题解决了吗我也是用自己的数据集跑的效果不好不确定这个具体是什么问题了，可能是没有预训练模型吧。我现在改用PaddleSpeech了，里面也包含FastSpeech2的具体实现，还提供了AISHELL3的预训练模型，可以把自己数据在提供的预训练模型上训练，效果比这个项目的效果要好很多。

语音标记点击音频播放没有声音

我也遇到了这个问题，有两段语音，第一段正常播放，第二段点击播放就是没有声音，目前还没确定是什么问题。

语音标记点击音频播放没有声音

应该是音频采样率的问题，我测着软件读取44100Hz的语音播放就没有声音，但是采样率改为16KHz后读取就正常可以播放声音了。

xuriliuhen

项目群扫码进不去了

项目群扫码进不去了

aishell3处理：使用mfa官方dict和声学模型处理aishell3

aishell3处理：使用mfa官方dict和声学模型处理aishell3

aishell3处理：使用mfa官方dict和声学模型处理aishell3

语音标记点击音频播放没有声音

语音标记点击音频播放没有声音