lancelee98
lancelee98
请问 conf/train_punc.yaml 这个里面的内容是什么? 为什么按照你的步骤会报这个错呀? @ROAD2018 
大家都是如何解决的呢?
 从文件导入后无法编辑文本
> 输入语音和文本指的是什么?一条一条的输入? 截图上我输入的是一个长音频,我接着对长音频进行标注就是我需要的功能;我先自己看看改改编辑功能吧;栓Q~
> 好 我也试试吧 修改的我也快改好了 我看看哪个方便吧。 我现在有的数据集是 音频+ 音频文本(文本不是一一对应,音频里的句子文本里都有)
试了试 合成后会有一些“噗噗”声,是声码器还需要做什么配置吗?
@wawaa 我这边是自己微调的模型,可能是我模型非流式也会有一些噪音
训练好的模型是否可商用呢?
> We trained vallex 1 epoch on MLS (40000H English) and Wenetspeech (10000H Chinese). I find the quality of the generated audio is unstable. Sometimes , the result is good...
> > 目前我们还没有研究过你想要的功能,红框内容表示 websocket 的性质有可能可以满足你想要的功能。这个得你自己再去研究研究~ > > 感谢大佬,我这边研究下,有啥成果的话,再分享到这里。 想问问你具体是怎么做的呢?