CosyVoice
CosyVoice copied to clipboard
Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.
Hi I have this types folders epoch_6_whole, which has .pt files. I cant load this file. How can I use finetuned llm model?
**Describe the bug** 更新版本后,调用 gradio api 报错:httpx.HTTPStatusError: Client error '403 Forbidden' 在 webUI 上,合成声音后,点击下载无反应 编写一个简短的脚本: ``` from gradio_client import Client, file client = Client("http://localhost:7860/") result = client.predict( tts_text="我是通义实验室语音团队全新推出的生成式语音大模型,提供舒适自然的语音合成能力。", prompt_wav_upload=None, #...
发现很多句子分词不准确,读破了,如何手工标记让他按照正群的分词来读? 比如下面这句话: 我父亲这个土匪种十四岁多一点。 正常的读应该是 我 父亲 这个 土匪种 十四岁 多一点。 但是这里居然给我按照这样读了: 我 父亲 这个 土匪 种十四岁 多一点。
感谢大佬的工作~ 我用相同的数据在25hz和50hz模型上面做微调,获得了如下的loss图(第一张是50hz,第二张是25hz),我感觉25hz模型过拟合了,您这边能帮我看看吗?  
声音复刻流式~~
想问下,声音复刻的流式推理是更新代码之后按照readme的流程,加入stream参数就可以了吗,我试了一下最新代码和旧代码,速度上好像差不多,是我操作有问题么?先感谢您的回答。
执行python3 webui.py --port 9886 --model_dir speech_tts/CosyVoice-300M后,在webui上点击任何按钮都会报超时错误,如下图 控制台报错信息如下。该怎么解决啊 ERROR: Exception in ASGI application Traceback (most recent call last): File "/opt/anaconda3/envs/cosyvoice/lib/python3.8/site-packages/pydantic/type_adapter.py", line 210, in __init__ core_schema = _getattr_no_parents(type, '__pydantic_core_schema__') File "/opt/anaconda3/envs/cosyvoice/lib/python3.8/site-packages/pydantic/type_adapter.py", line...
Hi, I'm trying your new code about streaming inference based on webui.py. I run this demo on A10, and I found the rtf of the first chunk is very high,...
操作:在主函数中每次推理前会更新一次随机种子,使得推理时相关的随机数每次都是一样的 问题: 1.虽然在每次推理前都更新了一遍随机种子,但是第一次生成的speech_len和第二次生成的speech_len的长度不一致,但是从第二次开始,能够保持speech_len的长度一致。根据打印的结果来看,第一次和第二次的差异来自于AR生成token时,在某一个位置开始,生成的token发生变化 2.语音生成的速度rtf随着次数的增加逐渐收敛(基本第三次的速度就是最终收敛的速度),收敛的速度小于前两次的速度,第一次速度最快
trying to run training (CosyVoice/examples/libritts/cosyvoice/run.sh), while doing the inference step i get this error: 'CosyVoiceModel' object has no attribute 'inference' when looking inside inference.py i see: model = CosyVoiceModel(configs['llm'], configs['flow'],...