cosyvoice3的几个问题
3不支持跨语种复刻和自然语言控制吗?
还有,希望对win友好一些,从1开始到3了,win上部署,还是困难重重
使用gradio生成的语言(预训练和3s极速复刻),会随机重复,有时候从头开始重复,有时候从开始重复 audio (1).wav
有人试过其他语言吗 日语几乎不可用呢 都念成中文 我把文本正则都关闭了
越来越诡异了,3s极速复刻,还会随机生成prompt文本里的内容 audio (2).wav
官方demo演示正常,兄台你这是什么环境下,生成性能如何
这个是github在本地搭建,gradio生成的效果 我感觉官方魔搭那个演示用的模型都不一样,我把魔搭那个代码克隆到本地,同一个参考音频生成的结果都不一样。
感觉这次更新很草率
感觉这次更新很草率
我刚好在训练2,然后我用零样本推理生成了3的音频,感觉还不如2生成的。训练更是代码有问题跑不了...
我测试下来 生成质量很不好,念字很机械,
发自我的iPhone
------------------ 原始邮件 ------------------ 发件人: Tina @.> 发送时间: 2025年12月16日 15:33 收件人: FunAudioLLM/CosyVoice @.> 抄送: Zeelong.Zhao @.>, Comment @.> 主题: Re: [FunAudioLLM/CosyVoice] cosyvoice3的几个问题 (Issue #1675)
是的,会复读,还会再开头重复参考音频,并且推理的音频读起来很机械。我还以为就我一个人是这样
发自我的iPhone
------------------ Original ------------------ From: Jandown @.> Date: Tue,Dec 16,2025 0:22 PM To: FunAudioLLM/CosyVoice @.> Cc: Zeelong.Zhao @.>, Comment @.> Subject: Re: [FunAudioLLM/CosyVoice] cosyvoice3 (Issue #1675)
Jandown left a comment (FunAudioLLM/CosyVoice#1675)
越来越诡异了,3s极速复刻,还会随机生成prompt文本里的内容 audio (2).wav
官方demo演示正常,兄台你这是什么环境下,生成性能如何
这个是github在本地搭建,gradio生成的效果 我感觉官方魔搭那个演示用的模型都不一样,我把魔搭那个代码克隆到本地,同一个参考音频生成的结果都不一样。
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>
tune一个人,感觉生成的效果还没cosyvoice2好