shenyanni
shenyanni
Hello! I use Chinese dataset, it has 5 speakers, total length of approximately 120 hours. Is 10000 epochs ok, or more epochs? how long will the training take, several days...
您好,在训练taco2和melgan之前,有些参数跟您确认下。 taco2的hparams中: silence_threshold=2, #silence threshold used for sound trimming for wavenet preprocessing #Mel spectrogram n_fft = 2048, #Extra window size is filled with 0 paddings to match this parameter hop_size...
作者您好! 您用THCHS-30数据集的全部说话人训练的Tacotron模型吗? 我之前只用过标贝单人数据集训练Tacotron,想请教一下多说话人需要什么设置?在hpamars里也没看到您关于speakers的设置。 感谢!~
您好!我之前用您此版taco2训练,结合wavernn效果很好。 但由于wavernn合成速度太慢,试着训练了[melgan](https://github.com/begeekmyfriend/melgan) melgan用的taco2预处理生成的trainingdata,训练到400step我测了一下,用trainingdata里的mel输入melgan合成语音效果较好,但用taco2模型生成的mel输入到melgan合成完全不正常,[wave](https://machine-audit-model.oss-cn-beijing.aliyuncs.com/shenyanni/tts/melgan_eval_epoch0400.wav) 参数我基本没有改,请问您有用taco2+melgan吗,效果如何? 我把taco2和melgan配置参数贴下,麻烦您帮忙看下是哪里出了问题呢?非常感谢!!! 【taco2参数:】 #Audio num_mels = 80, #Number of mel-spectrogram channels and local conditioning dimensionality rescale = False, #Whether to rescale audio prior to preprocessing rescaling_max =...
多gpu训练问题
您好,请问下此版本可以用多gpu训练吗?我修改了hparams.py中num_gpus = 1,train.py中--distributed-run True,然后在train_tacotron2.sh中CUDA_VISIBLE_DEVICES=0,1。 可是始终只用到了0号gpu,1上面没有。 是还需要设置什么吗?
作者您好, 感谢分享!! 想请教下,test_data下的crf.pt是crf训练所得模型文件吗?是make_model下的model.fit_crf训练的吗?我执行了model.fit_crf有训练过程但并没有生成模型文件。 test_sentences中,预测只用了随机森林,并没有用crf是吗? 另外test_data应该用与训练集毫无关系的测试集,是吧?我看您给出的示例代码都是dataset.pkl。