CosyVoice icon indicating copy to clipboard operation
CosyVoice copied to clipboard

情感控制功能支持

Open zwukong opened this issue 10 months ago • 7 comments

目前克隆后声音貌似不支持情感控制,无法使用instruct控制,能添加instruct控制功能就好了。不知道有没有支持的计划呢,有了情感控制适用性将大大提升,像游戏配音往往需要情绪的。

zwukong avatar Apr 08 '25 03:04 zwukong

看官方demo网页 https://funaudiollm.github.io/cosyvoice2/ 例:用生气的语气说<|endofprompt|>在交通高峰期,遭遇到一位鲁莽的司机插队,我感到非常生气。这种不文明的行为总让人无奈。

yuGAN6 avatar Apr 08 '25 06:04 yuGAN6

貌似克隆后声音不支持情感控制,只有预设的两个中文语音支持 @yuGAN6

zwukong avatar Apr 08 '25 06:04 zwukong

inference_instruct2本身也会复刻音色,只是韵律会更加偏向于instruct文本,也是有一定复刻能力的

aluminumbox avatar Apr 08 '25 09:04 aluminumbox

@aluminumbox 两个demo好像挂掉了,我记得页面上选了instruct就不能用CosyVoice2了,只能用CosyVoice-300M-Instruct模型,估计效果不如CosyVoice2吧。CosyVoice2后面会支持instruct吗

zwukong avatar Apr 08 '25 09:04 zwukong

instruct可以用CosyVoice2,只是要自己写代码

foxmale007 avatar Apr 12 '25 02:04 foxmale007

@foxmale007 怎么写呢,请指教 ~抱拳

zwukong avatar Apr 12 '25 06:04 zwukong

This issue is stale because it has been open for 30 days with no activity.

github-actions[bot] avatar May 13 '25 02:05 github-actions[bot]