CosyVoice cosyvoice3的几个问题

3不支持跨语种复刻和自然语言控制吗？

Dec 15 '25 15:12 Jandown

还有，希望对win友好一些，从1开始到3了，win上部署，还是困难重重

Dec 15 '25 15:12 Jandown

使用gradio生成的语言（预训练和3s极速复刻），会随机重复，有时候从头开始重复，有时候从开始重复 audio (1).wav

Dec 16 '25 00:12 Jandown

越来越诡异了，3s极速复刻，还会随机生成prompt文本里的内容

audio (2).wav

Dec 16 '25 00:12 Jandown

越来越诡异了，3s极速复刻，还会随机生成prompt文本里的内容

audio (2).wav

官方demo演示正常，兄台你这是什么环境下，生成性能如何

Dec 16 '25 01:12 hotdogarea

有人试过其他语言吗日语几乎不可用呢都念成中文我把文本正则都关闭了

Dec 16 '25 04:12 YangGuangzhaoJJJacky

越来越诡异了，3s极速复刻，还会随机生成prompt文本里的内容 audio (2).wav

官方demo演示正常，兄台你这是什么环境下，生成性能如何

这个是github在本地搭建，gradio生成的效果我感觉官方魔搭那个演示用的模型都不一样，我把魔搭那个代码克隆到本地，同一个参考音频生成的结果都不一样。

Dec 16 '25 04:12 Jandown

感觉这次更新很草率

Dec 16 '25 04:12 Jandown

感觉这次更新很草率

我刚好在训练2，然后我用零样本推理生成了3的音频，感觉还不如2生成的。训练更是代码有问题跑不了...

Dec 16 '25 07:12 828Tina

我测试下来生成质量很不好，念字很机械，

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: Tina @.> 发送时间: 2025年12月16日 15:33 收件人: FunAudioLLM/CosyVoice @.> 抄送: Zeelong.Zhao @.>, Comment @.> 主题: Re: [FunAudioLLM/CosyVoice] cosyvoice3的几个问题 (Issue #1675)

Dec 18 '25 03:12 hotdogarea

是的，会复读，还会再开头重复参考音频，并且推理的音频读起来很机械。我还以为就我一个人是这样

发自我的iPhone

------------------ Original ------------------ From: Jandown @.> Date: Tue,Dec 16,2025 0:22 PM To: FunAudioLLM/CosyVoice @.> Cc: Zeelong.Zhao @.>, Comment @.> Subject: Re: [FunAudioLLM/CosyVoice] cosyvoice3 (Issue #1675)

Jandown left a comment (FunAudioLLM/CosyVoice#1675)

越来越诡异了，3s极速复刻，还会随机生成prompt文本里的内容 audio (2).wav

官方demo演示正常，兄台你这是什么环境下，生成性能如何

这个是github在本地搭建，gradio生成的效果我感觉官方魔搭那个演示用的模型都不一样，我把魔搭那个代码克隆到本地，同一个参考音频生成的结果都不一样。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

Dec 18 '25 03:12 hotdogarea

tune一个人，感觉生成的效果还没cosyvoice2好

Dec 22 '25 02:12 wang-b22